Qué es Codex de OpenAI y por qué dejó de ser una herramienta para programadores

Cuando OpenAI lanzó Codex en abril de 2025, la promesa era simple: un modelo de IA especializado en escribir y revisar código, mejor que los modelos generales de propósito amplio para esa tarea específica. Catorce meses después, esa descripción ya no alcanza para explicar lo que es Codex.

Hoy Codex puede abrir aplicaciones en tu computadora, hacer clic, escribir texto, navegar páginas web de forma nativa, generar imágenes, recordar tus preferencias entre sesiones, conectarse a herramientas como Sentry o Datadog, y responder automáticamente a eventos de GitHub sin que nadie lo active manualmente. OpenAI lo resume con una frase que define bien hacia dónde va el producto: Codex pasó de ser un agente que escribe código a uno que usa el código para hacer tareas en tu computadora.

Qué es Codex en una explicación simple

Codex es el sistema de agentes de IA de OpenAI diseñado originalmente para programación, que evolucionó hacia una plataforma de automatización general. Funciona a través de cuatro superficies: una aplicación de escritorio (Mac y Windows), una extensión para editores de código (IDE), una interfaz de línea de comandos (CLI) y una versión en la nube. Las cuatro comparten historial, configuración y contexto — empezás una tarea en el CLI y la podés seguir revisando desde la app.

La diferencia con ChatGPT normal es la siguiente: ChatGPT responde preguntas y genera contenido en una conversación. Codex ejecuta tareas completas de forma autónoma dentro de un entorno aislado (sandbox), con acceso real a tu sistema, tus archivos y — desde abril de 2026 — tu computadora completa.

Qué es Codex de OpenAI y por qué dejó de ser una herramienta para programadores

FOTO: ilustrativa generada con IA a modo informativo.

Cómo funciona en la práctica

El flujo de trabajo típico con Codex es delegar, no conversar. En lugar de escribir código línea por línea junto al modelo, el usuario describe una tarea completa — "arreglá el error de TypeScript en el flujo de onboarding", "migrá el middleware de autenticación al nuevo sistema de sesiones", "creá un juego de carreras con ocho mapas y objetos que se usan con la barra espaciadora" — y Codex la ejecuta de principio a fin en un entorno aislado, sin tocar directamente tu código local hasta que el resultado esté listo para revisar.

Mientras un agente trabaja en una tarea, podés seguir trabajando en otra cosa o lanzar varios agentes en paralelo sobre proyectos distintos. La app de escritorio organiza cada uno en hilos separados con soporte para worktrees — lo que permite que múltiples agentes trabajen sobre el mismo repositorio sin pisarse entre ellos.

La capacidad que cambió todo: Computer Use

La actualización del 17 de abril de 2026 fue el punto de inflexión. OpenAI integró Computer Use en Codex: la capacidad del agente de operar aplicaciones de escritorio completas, no solo entornos de programación. Con un comando como "abrí Figma y actualizá los colores de los botones en la página de precios mientras yo sigo trabajando en otra cosa", Codex controla el mouse, el teclado y la pantalla para ejecutar la tarea de forma literal — en segundo plano, sin interrumpir lo que el usuario está haciendo en simultáneo.

Codex incorporó también un navegador integrado que permite dar instrucciones precisas sobre páginas web reales: seleccionar un elemento visual y describir el cambio que se quiere, por ejemplo. Para generación visual, usa el modelo gpt-image-1.5 — lo que permite combinar capturas de pantalla y código para crear maquetas, interfaces o conceptos de producto dentro del mismo flujo de trabajo.

La función de memoria permite que Codex aprenda de acciones previas del usuario y recuerde preferencias entre sesiones — sin tener que volver a explicar el contexto del proyecto cada vez que se abre una conversación nueva.

Estas funciones de control de computadora, personalización y memoria llegaron primero a macOS y a usuarios que ingresan con cuenta de ChatGPT. La disponibilidad para Europa y Reino Unido se demoró por cumplimiento normativo sobre uso de datos.

Los modelos detrás de Codex

El 5 de marzo de 2026, GPT-5.4 se convirtió en el modelo principal de Codex — el primer modelo de propósito general de OpenAI con Computer Use nativo integrado desde el diseño. Doce días después llegó GPT-5.4 mini, una versión más liviana que usa solo el 30% de la cuota de cómputo de GPT-5.4 y se especializa en subtareas rápidas y económicas, mientras GPT-5.4 se reserva para la planificación y el juicio final sobre tareas complejas.

El modelo anterior, GPT-5.3-Codex, lanzado en febrero de 2026, ya había alcanzado un 77,3% de autonomía en Terminal-Bench 2.0 — el benchmark que mide la capacidad de un agente de completar tareas complejas de terminal sin intervención humana, y ejecutaba flujos de trabajo completos un 25% más rápido que su predecesor.

Plugins, Triggers y el salto a "compañero de equipo"

La actualización de marzo de 2026 introdujo dos funciones que OpenAI describe como las más competitivas del año: Plugins, que conectan a Codex con herramientas de desarrollo como Sentry o Datadog para que tenga contexto real sobre errores y métricas de producción; y Triggers, que permiten a Codex responder automáticamente a eventos de GitHub — una nueva incidencia abierta dispara una respuesta de Codex en segundos, sin que ningún desarrollador tenga que activarlo manualmente.

OpenAI describe los Triggers con una frase elocuente: "un compañero de ingeniería que no duerme, no pide vacaciones y no discute si usar tabulaciones o espacios." La diferencia técnica con sistemas anteriores es que los Triggers funcionan por eventos, no por sondeo periódico — responden al instante en lugar de revisar cada ciertos minutos si hay algo nuevo.

La actualización más reciente: Codex para usuarios no técnicos

El 2 de junio de 2026 — hace apenas días — OpenAI presentó una actualización que marca un giro de posicionamiento explícito. Codex añadió plugins específicos por rol para perfiles no técnicos: analistas, equipos creativos, ventas, diseño de producto, inversión en renta variable y banca de inversión. También sumó "Sitios" — páginas interactivas alojadas que convierten el trabajo de un agente en un resultado que se puede compartir y revisar sin abrir ninguna herramienta técnica — y anotaciones, que permiten editar partes específicas de un resultado sin tener que rehacer todo el trabajo desde cero.

OpenAI reconoció abiertamente que la mayoría de los usuarios de Codex hoy ya no son programadores. Es la confirmación oficial de hacia dónde apunta el producto: de herramienta de nicho para desarrolladores a infraestructura general de automatización de trabajo de oficina.

Qué tan autónomo es realmente

El dato más concreto sobre las capacidades actuales viene de Terminal-Bench 2.0: 77,3% de autonomía en tareas complejas de terminal. En la práctica, eso significa que para refactorización de código, automatización de testing y tareas repetitivas de DevOps, Codex llega al objetivo solo en la gran mayoría de los casos.

Para diseño de arquitectura de software o código con dependencias muy específicas del negocio, todavía se necesita criterio humano explícito. Y la revisión del resultado antes de llevarlo a producción sigue siendo, según describe la documentación de OpenAI y reportan usuarios avanzados, un paso no negociable — Codex ejecuta con autonomía creciente, pero la decisión final de qué se integra al producto real sigue siendo humana.

El potencial real hacia adelante

La trayectoria de los últimos catorce meses sugiere hacia dónde va esto: ventanas de contexto cada vez más grandes, uso de herramientas cada vez más rico — pruebas automáticas, análisis estático, auditorías de paquetes — e integraciones cada vez más profundas con sistemas de control de versiones y entornos de producción.

OpenAI también adelantó en marzo de 2026 su plan de unificar ChatGPT, Codex y el navegador Atlas en una sola plataforma de computadora — un movimiento que busca competir directamente con el ecosistema de productos de Anthropic. Si esa unificación se completa, Codex deja de ser un producto independiente y se convierte en la capa de ejecución de tareas dentro de una superapp de IA mucho más amplia.

Lo que hoy distingue a Codex de otros asistentes de programación no es solo la capacidad de escribir código — es la combinación de autonomía prolongada, memoria entre sesiones, control real de aplicaciones de escritorio y conexión nativa con el ecosistema de herramientas que usan los equipos de desarrollo todos los días. Esa combinación es la que convirtió a Codex, en poco más de un año, en mucho más de lo que su nombre sugiere.