OpenAI lanzó Codex, un sistema de inteligencia artificial diseñado para ejecutar tareas de programación en la nube de forma autónoma y en paralelo. Disponible desde hoy para usuarios de ChatGPT Pro, Enterprise y Team, esta herramienta representa un paso más allá en la integración de agentes de IA en el ciclo de vida del software.
Codex no es solo un asistente conversacional, sino un agente de ingeniería que actúa directamente sobre repositorios reales. Puede escribir funcionalidades, corregir errores, ejecutar pruebas y proponer pull requests, todo dentro de entornos aislados y seguros, precargados con el código base del usuario.
El motor detrás de esta innovación es Codex-1, una versión especializada del modelo o3 de OpenAI. Fue entrenado mediante aprendizaje por refuerzo en tareas reales, lo que le permite seguir instrucciones con precisión, generar código coherente con el estilo del proyecto y refinar su trabajo mediante pruebas iterativas.
Acceder a Codex es sencillo. A través de la barra lateral de ChatGPT, los usuarios pueden asignar tareas específicas con instrucciones directas. Cada una se ejecuta en su propio contenedor seguro, sin acceso a internet, lo que refuerza la privacidad y reduce riesgos de uso malicioso o exposición de datos.
Te puede interesar: AlphaEvolve, la inteligencia artificial de Google que piensa como un matemático: ¿están en riesgo los humanos?
Además de escribir código, Codex es capaz de leer, modificar archivos y ejecutar herramientas como linters o test runners. Los resultados son verificables: cada acción queda registrada con logs, resultados de pruebas y mensajes de confirmación, lo que permite auditar el proceso.
Uno de los elementos clave para optimizar su rendimiento son los archivos AGENTS.md. Estos archivos, similares a un README, orientan a Codex sobre la estructura del repositorio, comandos relevantes y buenas prácticas. Si bien Codex funciona sin ellos, su presencia mejora la calidad de las tareas ejecutadas.
Codex no solo busca eficiencia técnica, sino también alineación con los estándares humanos. Los parches generados por Codex-1 son más limpios y están pensados para ser revisados e integrados fácilmente, acercándose cada vez más al trabajo de un desarrollador experimentado.
En cuanto a seguridad, OpenAI ha entrenado a Codex para rechazar solicitudes que involucren software malicioso. El agente puede diferenciar entre tareas legítimas y usos riesgosos, manteniéndose dentro de marcos de política reforzados y con validaciones internas rigurosas.
Empresas como Cisco, Kodiak y Temporal ya están utilizando Codex en sus flujos de trabajo. Algunos equipos lo emplean para refactorizar grandes bases de código, otros para mejorar cobertura de pruebas o acelerar la depuración. Incluso se ha convertido en una herramienta útil para gestores de producto que realizan cambios ligeros en código.
En paralelo, OpenAI también actualizó Codex CLI, una herramienta de línea de comandos con soporte para el modelo codex-mini-latest. Esta versión más liviana es ideal para flujos rápidos y preguntas técnicas dentro del terminal, con mejoras en latencia y facilidad de integración.
Te puede interesar: ¿El fin del programador? Así conviven el no-code y los desarrolladores reales
Actualmente, Codex se encuentra en etapa de vista previa de investigación. Aunque ya muestra resultados prometedores, todavía presenta limitaciones: no puede trabajar con imágenes ni corregir su curso en medio de una tarea. Sin embargo, el plan es convertirlo en una experiencia más fluida, parecida a colaborar con un colega en modo asincrónico.
Para los desarrolladores, Codex representa un cambio estructural. Al delegar tareas repetitivas o tediosas a un agente autónomo, pueden centrarse en problemas complejos y estratégicos. Esto podría redefinir los roles dentro de los equipos de desarrollo, potenciar a los equipos pequeños y acelerar la entrega de productos.
En los próximos meses, OpenAI planea ampliar el acceso a usuarios Plus y Edu, introducir nuevas integraciones con herramientas de desarrollo y permitir mayor interacción con los agentes durante las tareas. El objetivo es claro: crear una IA que trabaje codo a codo con los humanos.
Imagen: OpenAI