Acerca de la generación de expresiones regulares con Digitalización secreta de Copilot
Secret scanning explora repositorios en busca de un conjunto predefinido de secretos de nuestro programa de socios, así como patrones personalizados definidos por el usuario. Los patrones personalizados se formatean como expresiones regulares.
Las expresiones regulares no son fáciles de escribir. El generador de expresiones regulares del Digitalización secreta de Copilot te permite definir tus patrones personalizados sin tener conocimientos sobre expresiones regulares. En la página de patrones personalizados existente, puedes iniciar una experiencia de IA generativa en la que escribes una descripción de texto del patrón que te gustaría detectar, incluyes cadenas de ejemplo opcionales que deberían detectarse y obtienes a cambio expresiones regulares coincidentes.
Procesamiento de entradas
Los usuarios escriben una descripción de texto de lo que les gustaría detectar y ejemplos opcionales de cadenas que deberían detectarse.
Generación de respuestas y formato de salida
El generador de expresiones regulares del Digitalización secreta de Copilot usa GPT-3.5-Turbo y la API de GitHub Copilot para generar expresiones regulares que coincidan con tu entrada.
El modelo devuelve hasta tres expresiones regulares para revisar. Puedes hacer clic en la expresión regular para obtener una descripción en lenguaje llano de la expresión regular generada por la IA.
Algunos resultados pueden coincidir bastante, y otros pueden no encontrar todos los casos del secreto que el patrón pretende detectar. También es posible que el generador de expresiones regulares produzca resultados no válidos o inapropiados.
Al hacer clic en Usar resultado en una expresión regular, la expresión y los ejemplos introducidos se copiarán en el formulario principal de patrones personalizados. Desde allí, puedes realizar una prueba del patrón para ver cómo funciona en tu repositorio u organización.
Mejora del rendimiento al generar expresiones regulares con IA
Para mejorar el rendimiento y abordar algunas de las limitaciones del generador de expresiones regulares del Digitalización secreta de Copilot, hay varias medidas que puedes adoptar. Para obtener más información sobre las limitaciones de generador de expresiones regulares, consulte "Limitaciones de la generación de expresiones regulares con IA".
Uso del generador de expresiones regulares del Digitalización secreta de Copilot
como herramienta, no como reemplazo
Aunque es una potente herramienta para crear patrones personalizados sin tener que escribir expresiones regulares, es importante usarla como herramienta y no como reemplazo de la entrada manual de datos. Se debe validar cuidadosamente el rendimiento de los resultados mediante la realización de una ejecución en seco a través de su organización o repositorio. Se recomienda ejecutar el patrón en un repositorio (o repositorios) que sean representativos de los repositorios de la organización. En algunos casos, puede resultar beneficioso modificar una expresión regular generada para que se ajuste mejor a tus necesidades. En última instancia, la responsabilidad de los patrones personalizados que decidas usar recae sobre ti.
Limitaciones de la generación de expresiones regulares con IA
En función de factores como la descripción de la entrada y los ejemplos, puedes experimentar distintos niveles de rendimiento al usar el generador de expresiones regulares del Digitalización secreta de Copilot. Tiene que ser muy específico con su descripción y proporcionar diferentes tipos de ejemplos de tokens que coincidan con su patrón, para asegurarse de que la expresión regular abarca todos los patrones que quiere que secret scanning busque.
Además, el modelo que usa el se entrenó con contenido en lenguaje natural escrito mayormente en inglés. Como resultado, es posible que notes un rendimiento diferente cuando proporciones al generador entradas en lenguaje natural en idiomas distintos del inglés.
Ten en cuenta que el generador de expresiones regulares del Digitalización secreta de Copilot solo es adecuado para crear expresiones regulares a fin de detectar patrones estructurados.