OpenAI acaba de presentar la esperada inteligencia de programación Codex, una potente herramienta integrada con ChatGPT que ha entrado oficialmente en la fase de vista previa de investigación. Como sistema de asistencia a la ingeniería de software basado en la nube, se espera que Codex revolucione la forma de trabajar de los desarrolladores, mejore la eficiencia de la programación y simplifique el procesamiento de tareas complejas. En este artículo, ofreceremos un análisis exhaustivo de las características, los principios de funcionamiento y las aplicaciones prácticas de esta revolucionaria tecnología.
Entrada al sitio web oficial:https://openai.com/index/openai-codex/

Códice Cuerpos inteligentes: el comienzo de una nueva era de programación
OpenAI lanzó la inteligencia de programación Codex en mayo de 2025, tras añadir la posibilidad de conectarse a repositorios de GitHub en ChatGPT. Se trata de una inteligencia de ingeniería de software basada en la nube capaz de realizar diversas tareas de programación, entre ellas:
- Creación de nuevos módulos funcionales
- Corrección de errores y vulnerabilidades del código
- Ejecución de la verificación de pruebas
- Envío de cambios en el código
- Gestionar y ejecutar simultáneamente múltiples tareas de codificación
A diferencia de los asistentes de programación tradicionales, Codex se basa en el modelo codex-1 (que es una versión especializada del modelo o3 de OpenAI) optimizado específicamente para la ingeniería de software, y se entrena mediante aprendizaje por refuerzo en un entorno de programación real para que el código que genera refleje los estilos de codificación humanos, siga las instrucciones al pie de la letra y pueda probarse repetidamente hasta lograr los resultados deseados.

Cómo funciona el Codex y sus principales características
flujo de trabajo
El flujo de trabajo de Codex está diseñado para ser sencillo e intuitivo:
- Acceso del usuario al Códice a través de la barra lateral de ChatGPT
- Introduzca sus requisitos y haga clic en el botón "Código" para asignar una tarea, o en el botón "Preguntas y respuestas" para hacer una pregunta relacionada con el código.
- Codex realiza las tareas en un entorno seguro y aislado en la nube que está precargado con la base de código del usuario.
- Los usuarios pueden seguir el progreso de las tareas en tiempo real
- Una vez finalizada la tarea, Codex confirma los cambios y proporciona pruebas detalladas de la aplicación, incluidos los registros de terminal y los resultados de las pruebas.
- Los usuarios pueden revisar los resultados, solicitar nuevas modificaciones o integrar los cambios en el flujo de trabajo
Principales características técnicas
caracterización | descripciones |
---|---|
multitarea | Capacidad para gestionar simultáneamente varias tareas de programación independientes |
Ejecutar en la nube | Las tareas se ejecutan en contenedores en la nube aislados de forma segura, sin ocupar recursos locales. |
Integración de bases de código | Admite una integración perfecta con los repositorios de GitHub, lo que permite leer y manipular directamente el código del usuario. |
Comprensión inteligente de códigos | Capacidad para comprender estructuras de código complejas, identificar posibles problemas y aportar soluciones. |
cadena de custodia completa | Proporcionar pruebas verificables de la ejecución de las tareas mediante registros de terminales, resultados de pruebas, etc. |
Configuración del entorno | Admite configuraciones personalizadas para adaptar el entorno a la configuración real de desarrollo. |
Seguridad y protección | El acceso a Internet se desactiva durante la ejecución y se limita la interacción con el código y las dependencias explícitamente autorizadas. |
Vale la pena señalar que Codex permite seguir la base de código de AGENTES.md
Guías de documentación, similares a un desarrollador humano que lee un archivo README para comprender las especificaciones de un proyecto. Codex funciona mejor cuando está correctamente configurado, probado de forma fiable y claramente documentado.
Caso práctico: Demostración de la competencia de programación del Codex
A continuación se muestran ejemplos del uso de Codex en proyectos reales de código abierto, que demuestran su capacidad para gestionar una gran variedad de tareas de programación:
Caso 1: Solución de un problema de cálculo de modelos compuestos anidados en la biblioteca astropy
En este caso, Codex necesitaba resolver el problema de que la separability_matrix del módulo Modeling del repositorio astropy/astropy no calculaba correctamente la separabilidad de los CompoundModels anidados.

El Codex generó una modificación del código muy concisa y precisa, con sólo los cambios necesarios en el núcleo del problema. En cambio, el esquema de modificación del modelo o3 era más largo e incluso añadía algunos comentarios innecesarios.

Caso 2: Corrección de errores de calibración de ventanas matplotlib
Esta tarea requiere que se arregle la biblioteca matplotlib. mlab._spectral_helper
La corrección de la ventana es incorrecta.

Codex también demuestra la capacidad de arreglar las cosas con precisión y sencillez, modificando sólo las líneas de código necesarias para mantener la claridad y la mantenibilidad.

Caso 3: Resolver el problema de la expresión de duración en django
En este caso, era necesario solucionar un problema en el framework django por el que las expresiones que sólo contenían duración no funcionaban correctamente en SQLite y MySQL.

Codex no sólo proporciona una solución limpia, sino que también rellena primero las llamadas a dependencias que faltan, lo que demuestra su capacidad para comprender plenamente el contexto del código.

Caso 4: Solucionar el problema de actualización del nombre de la sala de chat de los miembros de expensify
Este caso se refiere a un fallo en expensify (un software de colaboración financiera centrado en el chat): tras borrar la caché, los nombres de las salas de chat de los miembros no se actualizaban en LHN.

Codex señaló el problema y proporcionó una solución precisa y eficaz, mientras que el modelo o3 realizó algunos cambios de código ineficaces.

Evaluación de resultados y análisis comparativo
puntuación inicial
En la prueba SWE-Bench Verified, Codex (codex-1) obtuvo unos resultados impresionantes:
modelización | Puntuación SWE-bench |
---|---|
Códice (codex-1) | 72.1% |
Claude 3,7 | 62.3% |
o3-alto | 71.7% |
Las pruebas se realizaron con una longitud de contexto de hasta 192.000 fichas, utilizando una configuración media de "esfuerzo de razonamiento", la misma que está disponible actualmente en las versiones de productos Codex.

Comparación de la generación de código con el modelo o3
Ejemplos del mundo real demuestran que codex-1 genera sistemáticamente parches de cambios de código más limpios y claros que OpenAI o3, que pueden revisarse manualmente de forma inmediata e integrarse en flujos de trabajo estándar. En múltiples pruebas de bibliotecas de código abierto, codex demostró una mayor precisión y una mejor calidad del código.
Comentarios sobre el uso real
El equipo interno de OpenAI ha adoptado Codex como parte de sus herramientas de desarrollo diarias, principalmente para realizar tareas repetitivas y bien delimitadas, como refactorizar el código, renombrar y escribir pruebas que normalmente interrumpen el flujo de concentración de un desarrollador.
Además, las primeras pruebas con varios socios externos, como Cisco, Temporal, Superhuman y Kodiak, han demostrado que Codex acelera considerablemente tareas como el desarrollo de funciones, la depuración de problemas, la redacción y ejecución de pruebas, y mejora la eficiencia del equipo.
Disponibilidad, precios y perspectivas
Disponibilidad actual
El Codex está abierto a los siguientes usuarios:
- Usuarios de ChatGPT Pro (200 $ al mes)
- Usuarios de ChatGPT Enterprise
- Usuarios del equipo ChatGPT
Los usuarios de ChatGPT Plus y Edu pronto podrán utilizar también esta función.
estrategia de precios
Actualmente, OpenAI ofrece un periodo de prueba gratuito en el que los usuarios pueden probar la funcionalidad del Codex sin restricciones durante las próximas semanas. Después se introducirán límites de velocidad y opciones flexibles de pago por uso.
Para los desarrolladores, el modelo codex-mini-latest está disponible en la API Responses para:
- Fichas por millón de entradas: $1,50
- Fichas por millón de producción: $6,00
- Disfruta de un descuento en la caché de alerta del 75%
El camino a seguir
OpenAI tiene previsto seguir mejorando la interactividad y flexibilidad de Codex:
- Apoyo en la orientación y retroalimentación durante la ejecución del mandato
- Colaborar con AI para aplicar estrategias de programación
- Reciba notificaciones proactivas de actualización de los progresos
- Profunda integración con herramientas de desarrollo populares (por ejemplo, GitHub, línea de comandos, gestores de incidencias, sistemas CI)
El lanzamiento de Codex Intelligent Body marca una nueva etapa en la programación asistida por IA. En lugar de sustituir a los ingenieros, actúa como un asistente fiable para tareas tediosas y repetitivas, lo que permite a los desarrolladores centrarse en un trabajo más creativo y estratégico. Aunque todavía está en fase de investigación previa y tiene algunas limitaciones (por ejemplo, falta de acceso a internet, largos tiempos de respuesta a las tareas, etc.), Codex ha demostrado tener un gran potencial para remodelar la lógica subyacente del desarrollo de software y convertirse en una parte importante del futuro paradigma de la programación.