El 21 de abril de 2026, OpenAI presentó ChatGPT Images 2.0 en un livestream oficial. El modelo subyacente se llama gpt-image-2 en la API y reemplaza a GPT Image 1.5 como el generador de imágenes por defecto en ChatGPT para usuarios Plus, Pro, Team y Free. Enterprise y Edu siguen en proceso de despliegue.
La reacción del mercado fue inmediata: en menos de 12 horas desde el lanzamiento, gpt-image-2 tomó el primer lugar en Image Arena — el leaderboard independiente de evaluación de modelos de imagen — con una ventaja de 242 puntos sobre el segundo clasificado, la mayor diferencia registrada en la historia de ese benchmark.
El CEO Sam Altman lo describió durante el livestream con una comparación directa: "Esto es como pasar de GPT-3 a GPT-5 de una sola vez."
El cambio más importante: el modelo ahora piensa antes de generar
La novedad arquitectónica central de ChatGPT Images 2.0 es que incorpora razonamiento nativo — el modelo puede analizar el pedido, buscar información en internet, revisar archivos que el usuario sube (PDFs, capturas de pantalla, guías de marca) y planificar la composición antes de generar un solo píxel.

Esto se traduce en dos modos de uso:
Modo Instant: genera rápidamente, priorizando velocidad. Incluye todas las mejoras de texto y multilingüe. Es el modo por defecto para la mayoría de las tareas.
Modo Thinking: agrega un paso de razonamiento antes de generar. Puede buscar en la web en tiempo real, analizar materiales subidos, generar hasta 8 imágenes coherentes desde un solo prompt con consistencia de personajes y objetos entre ellas, y verificar su propio output antes de entregarlo. Puede tardar hasta dos minutos en prompts complejos. Es el modo que permite generar páginas completas de manga con personajes recurrentes, infografías densas o presentaciones de 4 diapositivas coherentes desde un solo mensaje.
Texto legible dentro de las imágenes
Durante años, el punto más débil de todos los modelos de imagen con IA fue el texto: letreros con letras garrapiñadas, menús con palabras inventadas, logos distorsionados. ChatGPT Images 2.0 trata el texto como un elemento de primera clase.
El modelo puede renderizar texto legible en más de 10 sistemas de escritura: latino, japonés, coreano, chino, árabe, devanagari, cirílico, bengalí y otros. Los titulares permanecen nítidos a 2K de resolución. Los textos pequeños de descripción siguen siendo legibles. Las fechas, precios, etiquetas y SKUs siguen el prompt en lugar de autocorregirse con texto inventado.
Según OpenAI, este es el cambio que transforma la generación de imágenes de "buena para un mood board" a "buena para el entregable final".
Edición precisa con memoria visual
La otra mejora clave es la edición. Cuando el usuario sube una foto y pide un cambio específico — "quitá el fondo pero dejá la persona igual" — el modelo ahora cambia exactamente lo que se le pide mientras preserva iluminación, composición y la apariencia de las personas con una fidelidad muy superior a versiones anteriores.
La consistencia se mantiene entre ediciones sucesivas: si estás diseñando un personaje, su apariencia se conserva igual a través de múltiples iteraciones y ajustes.
Velocidad 4 veces mayor
Las imágenes se generan hasta 4 veces más rápido que con el modelo anterior. Además, se pueden seguir generando imágenes nuevas mientras otras todavía están en proceso — sin esperar a que termine una para empezar la siguiente.
Dónde está disponible y qué pasa con DALL-E
ChatGPT Images 2.0 está disponible en ChatGPT, Codex y la API de OpenAI (como gpt-image-2). La resolución máxima es 2K con soporte de aspect ratios desde 3:1 hasta 1:3.
OpenAI anunció que DALL-E 2 y DALL-E 3 serán retirados el 12 de mayo de 2026. El modelo de conocimiento tiene corte en diciembre de 2025, lo que significa que puede renderizar correctamente logos actuales, diseños de productos y referencias culturales recientes que el modelo anterior todavía trataba con datos de 2024.
El contexto competitivo
El lanzamiento llega en un momento de intensa competencia en generación de imágenes. Midjourney, Stable Diffusion, Imagen de Google y el reciente Flux 2 compiten por el mismo mercado. ChatGPT Images 2.0 no apunta a ser el modelo más artístico — apunta a ser el más útil para producción: texto correcto, edición precisa, integración conversacional y velocidad.
OpenAI espera que el lanzamiento reproduzca el efecto viral que tuvo la generación de imágenes estilo Studio Ghibli con GPT-4o hace un año, esta vez con el fotoRealismo como gancho. ChatGPT superó los 900 millones de usuarios activos semanales en febrero de 2026 y la empresa apunta a llegar al billón.
Comentarios
💬 Iniciar sesión para comentar💬 Sumate a la conversación e iniciá sesión para comentar.