OpenAI está lanzando un nueva variation de ChatGPT Images que promete un mejor seguimiento de instrucciones, una edición más precisa y velocidades de generación de imágenes hasta 4 veces más rápidas.

El nuevo modelo, denominado GPT-Image- 1 5, está disponible a partir del martes para todos los usuarios de ChatGPT y a través de la API. Es la última escalada en la competencia disadvantage Gemini de Google después de que el CEO de OpenAI, Sam Altman, declarara el mes pasado un “código rojo” en un memorando interno filtrado. El memorando detalla los airplanes de OpenAI para recuperar su posición como líder en IA después de que Google comenzara a ganar participación de mercado tras el lanzamiento de Gemini 3, su último modelo insignia, y Nano Banana Pro, la versión más reciente del generador de imágenes virales de Google, los cuales han encabezado la lista. Clasificación LMArena a través de múltiples puntos de referencia.

Google mantiene su liderazgo incluso después de que OpenAI respondiera a su éxito la semana pasada con el lanzamiento de GPT- 5 2, presentándolo como su modelo más avanzado hasta el momento para desarrolladores y uso profesional diario. Según se informa, OpenAI había estado planeando lanzar un nuevo generador de imágenes a principios de enero, acelerando esos aircrafts trick el anuncio de esta semana. Su último lanzamiento de modelo de imagen fue GPT-Image- 1 en abril.

GPT-Image- 1 5 llega a medida que los generadores de imágenes y videos avanzan más allá de los prototipos y obtienen más capacidades listas para la producción. Al igual que Nano Banana Pro, ChatGPT Images ofrece funciones de posproducción, que brindan controles de edición más granulares para mantener la coherencia aesthetic, como el parecido face, la iluminación, la composición y el tono de color en todas las ediciones.

La misma imagen que se muestra arriba con diferentes ediciones para mostrar el seguimiento de instrucciones mejorado de GPT-Image- 1 5 Créditos de imagen: Abierto AI

La mayoría de las herramientas de imágenes GenAI boy malas en iteración, por lo que esto sería un gran paso adelante. Cuando se les pide un cambio específico, como “ajustar la expresión facial” o “hacer la iluminación más fría”, los modelos a menudo reinterpretan la imagen completa, lo que genera una falta de coherencia.

La actualización no se trata sólo de nuevas funciones. Ahora también se podrá acceder a las imágenes de ChatGPT a través de un punto de entrada dedicado en la barra lateral de ChatGPT que funciona “más como un estudio creativo”, dijo Fidji Simo, director ejecutivo de aplicaciones de OpenAI. escribió en una publicación de blog site el martes.

“Las nuevas pantallas de visualización y edición de imágenes facilitan la creación de imágenes que coincidan disadvantage su visión o se inspiren en indicaciones de tendencias y filtros preestablecidos”, escribió Simo.

Evento tecnológico

san francisco | 13 – 15 de octubre de 2026

Además del nuevo generador de imágenes, OpenAI está introduciendo nuevas formas de mejorar la experiencia ChatGPT disadvantage más elementos visuales. El plan es hacer que las consultas de búsqueda muestren más imágenes disadvantage fuentes claras, lo que podría ser útil para tareas como convertir medidas o verificar resultados deportivos, según Simo.

“Cuando estás creando, deberías poder ver y dar forma a lo que estás haciendo. Cuando las imágenes cuentan una historia mejor que las palabras solas, ChatGPT debería incluirlas”, escribió Simo. “Cuando necesitas una respuesta rápida o el siguiente paso reside en otra herramienta, debería estar ahí. Mientras hacemos esto, podemos seguir acortando la distancia entre lo que tienes en mente y tu capacidad para darle vida”.

Fuente