Skip to main content

Uso responsable de la IA para definir expresiones regulares

Obtenga información sobre las funcionalidades y limitaciones del generador de expresiones regulares a la hora de ayudarle a definir patrones personalizados para ampliar las funcionalidades del secret scanning.

¿Quién puede utilizar esta característica?

Digitalización secreta de Copilot está disponible para los repositorios siguientes:

  • Repositorios públicos, privados e internos en organizaciones que usan GitHub Enterprise Cloud con GitHub Advanced Security habilitado

Acerca de la generación de expresiones regulares con IA

Secret scanning explora repositorios en busca de un conjunto predefinido de secretos de nuestro programa de socios, así como patrones personalizados definidos por el usuario. Los patrones personalizados se formatean como expresiones regulares.

Las expresiones regulares no son fáciles de escribir. El generador de expresiones regulares te permite definir tus patrones personalizados sin tener conocimientos de expresiones regulares. En la página de patrones personalizados existente, puedes iniciar una experiencia de IA generativa en la que escribes una descripción de texto del patrón que te gustaría detectar, incluyes cadenas de ejemplo opcionales que deberían detectarse y obtienes a cambio expresiones regulares coincidentes.

Procesamiento de entradas

Los usuarios escriben una descripción de texto de lo que les gustaría detectar y ejemplos opcionales de cadenas que deberían detectarse.

Generación de respuestas y formato de salida

El generador de expresiones regulares usa GPT-3.5-Turbo y la API GitHub Copilot para generar expresiones regulares que coincidan con los datos de entrada.

El modelo devuelve hasta tres expresiones regulares para revisar. Puedes hacer clic en la expresión regular para obtener una descripción en lenguaje llano de la expresión regular generada por la IA.

Algunos resultados pueden coincidir bastante, y otros pueden no encontrar todos los casos del secreto que el patrón pretende detectar. También es posible que el generador de expresiones regulares produzca resultados no válidos o inapropiados.

Al hacer clic en Usar resultado en una expresión regular, la expresión y los ejemplos introducidos se copiarán en el formulario principal de patrones personalizados. Desde allí, puedes realizar una prueba del patrón para ver cómo funciona en tu repositorio u organización.

Mejora del rendimiento al generar expresiones regulares con IA

Para mejorar el rendimiento y abordar algunas de las limitaciones de generador de expresiones regulares, hay varias medidas que puedes adoptar. Para obtener más información sobre las limitaciones de generador de expresiones regulares, consulte "Limitaciones de la generación de expresiones regulares con IA".

Usa como una herramienta , no como un reemplazo

Aunque es una potente herramienta para crear patrones personalizados sin tener que escribir expresiones regulares, es importante usarla como herramienta y no como reemplazo de la entrada manual de datos. Se debe validar cuidadosamente el rendimiento de los resultados mediante la realización de una ejecución en seco a través de su organización o repositorio. Se recomienda ejecutar el patrón en un repositorio (o repositorios) que sean representativos de los repositorios de la organización. En algunos casos, puede resultar beneficioso modificar una expresión regular generada para que se ajuste mejor a tus necesidades. En última instancia, la responsabilidad de los patrones personalizados que decidas usar recae sobre ti.

Limitaciones de la generación de expresiones regulares con IA

En función de factores como la descripción de la entrada y los ejemplos, puede experimentar diferentes niveles de rendimiento al usar . Tiene que ser muy específico con su descripción y proporcionar diferentes tipos de ejemplos de tokens que coincidan con su patrón, para asegurarse de que la expresión regular abarca todos los patrones que quiere que secret scanning busque.

Además, el modelo que usa el se entrenó con contenido en lenguaje natural escrito mayormente en inglés. Como resultado, es posible que notes un rendimiento diferente cuando proporciones al generador entradas en lenguaje natural en idiomas distintos del inglés.

Nota: solo es adecuado para crear expresiones regulares para detectar patrones estructurados.

Información adicional