
Inteligencia Artificial (IA)
31 oct 2025
OpenAI lanza Aardvark, su nuevo agente de investigación en seguridad
OpenAI presenta Aardvark, un investigador de seguridad impulsado por GPT-5, diseñado para equipos de software que buscan detectar y corregir vulnerabilidades en grandes repositorios de código. Integrado con GitHub, automatiza el análisis, valida fallos en sandbox y propone parches listos para revisión, reduciendo falsos positivos y mejorando la seguridad continua.

OpenAI ha presentado Aardvark, un avanzado investigador de seguridad automatizado impulsado por GPT-5, actualmente en beta privada para socios seleccionados. Esta herramienta está orientada a equipos de software que necesitan detectar vulnerabilidades y proponer parches de manera continua en grandes bases de código. Aardvark funciona como una canalización de múltiples etapas: analiza repositorios completos, construye modelos de amenazas, monitorea nuevos commits y señala problemas con explicaciones detalladas paso a paso. Los posibles errores se validan en un entorno aislado para confirmar su explotabilidad. Para las correcciones, adjunta un parche generado por Codex listo para revisión humana y fusión con un solo clic.
La integración con GitHub y flujos de trabajo existentes es fluida, y el sistema busca reducir falsos positivos al probar los hallazgos antes de reportarlos. Según OpenAI, Aardvark ha sido utilizado internamente y por socios alfa durante los últimos meses. En pruebas con repositorios de referencia, identificó el 92% de las vulnerabilidades conocidas y sintéticas. Además, ha reportado problemas en proyectos open source, logrando que diez de sus hallazgos reciban identificadores CVE.
OpenAI ha actualizado su política de divulgación y planea ofrecer escaneos pro bono para proyectos open source no comerciales seleccionados. Aardvark se posiciona como parte de la estrategia de seguridad “defender-first” de OpenAI, respaldada por GPT-5 y Codex. La compañía destaca meses de despliegue interno, nuevas prácticas de divulgación y la intención de ampliar el acceso una vez que la beta privada demuestre su fiabilidad a gran escala.






