En marzo, mientras estaba prueba y revisión En la primera iteración del modelo de imagen de OpenAI, le di al chatbot lo que pensé que sería una prueba sencilla: hazme una infografía que explique el ciclo del agua. Esa prueba terminó siendo una especie de desastre. Entonces, cuando OpenAI anunciado su nuevo modelo 1.5 y su interfaz de Imágenes ChatGPT, estaba listo para darle otra oportunidad. Lamentablemente, lo que encontré fue emblemático del progreso y los problemas persistentes con los medios generativos en 2025.

Quédate conmigo un minuto y recuerda cuándo aprendiste por primera vez sobre el ciclo del agua. Para mí, fue en la escuela primaria y teníamos una canción que rimaba para ayudarnos a recordar cómo se transforma el agua en el medio ambiente, desde el vapor de agua hasta las nubes y la lluvia. Recuerdo vívidamente haber visto en clase diferentes imágenes y vídeos que explicaban las diferentes fases.

Arte de la insignia CNET AI Atlas; haga clic para ver más

Entonces, para una empresa que dice que el GPT-5 de su chatbot es tan inteligente como un doctorado., ¿por qué sus modelos de imágenes no pueden representar un gráfico simple de uno de los procesos geológicos más básicos (o deberíamos decir, elementales) y mejor documentados?

(Divulgación: Ziff Davis, la empresa matriz de CNET, presentó en abril una demanda contra OpenAI, alegando que infringió los derechos de autor de Ziff Davis al entrenar y operar sus sistemas de IA).

Una infografía creada por IA explica el ciclo del agua, pero lo ha generado con errores.

Esto ha mejorado mucho para ChatGPT, pero aún no es perfecto. Las flechas no apuntan en la dirección correcta.

Creado por Katelyn Chedraoui usando ChatGPT

Si tuviera que defender ChatGPT, señalaría que esta infografía más reciente es mucho mejor que las versiones anteriores. El texto finalmente es legible, un gran paso adelante incluso desde hace un mes. Incluía todas las fases y sus fuentes, según lo solicitado. Pero las flechas todavía están equivocadas, ya que la flecha vertical de la precipitación da la impresión de que la lluvia puede volar hacia arriba desde el suelo. Le pregunté tres veces más después del fracaso inicial y los resultados fueron prácticamente idénticos.

Una infografía generada por IA describe cuatro fases del ciclo del agua. El gráfico incluye errores, incluido un error tipográfico. Bajo evaporación, los giros se escriben tarns.

Con el modelo de imagen original de OpenAI, me llevó más de 20 indicaciones y 2 horas crearlo. Todavía hay errores.

Creado por Katelyn Chedraoui usando ChatGPT

Estoy seguro de que nadie que utilice la nueva función Imágenes ChatGPT está tan interesado como yo en su capacidad para representar correctamente el ciclo del agua. Quizás estoy siendo demasiado exigente. Pero el problema resalta un problema constante con OpenAI: puede que tenga uno de los chatbots más utilizados, pero sus servicios creativos dejan mucho que desear. Eso no solía ser un gran problema, hasta que Google cambió las reglas del juego este verano.

Una tarjeta navideña creada con una imagen de cuatro personas sonrientes. La tarjeta navideña muestra evidencia de haber sido sometida a IA.

Esta tarjeta navideña creada por ChatGPT conserva bastante bien los rasgos de mis amigos y los míos de la foto original (izquierda), pero nuestra piel aún tiene ese aspecto brillante de IA.

Creado por Katelyn Chedraoui usando ChatGPT

Imágenes ChatGPT de OpenAI frente a Nano Banana de Google

OpenAI y Google han estado compitiendo a lo largo de 2025 en la carrera por la IA más avanzada. Google, en su mayor parte, ha tomado la delantera, pero OpenAI nunca se ha quedado atrás. Cuando Google eliminó los modelos de imágenes y videos líderes en la industria, como Veo 3 y nanoplátanoOpenAI seguiría unas semanas más tarde con sora y ahora Imagen 1.5. Este modelo de imagen en particular, junto con GPT 5.2es probablemente el resultado de un “código rojo” interno que OpenAI supuestamente emitió debido a la preocupación por la destreza técnica que Google mostró con su reciente familia de modelos en Géminis 3.

En otras palabras, las dos principales empresas de tecnología, aunque tradicionalmente no son conocidas por su historia creativa, han estado invirtiendo fuertemente en IA creativa. Ha conducido a avances técnicos masivos, y muchas preocupaciones.

Dos imágenes generadas por IA del gato esmoquin en el tablero Monopoly están una al lado de la otra para comparar qué tan realista es un generador sobre el otro.

Las imágenes de ChatGPT (derecha) se han mejorado con respecto a las versiones anteriores, pero no engañan a nadie como lo son las imágenes de IA de Gemini (izquierda).

Creado por Jon Reed usando Gemini y ChatGPT

Nano Banana Pro de Google es nuestro recientemente coronado mejor generador de imágenes de IA de 2025, y fue uno de los programas de IA más impresionantes e inspiradores que he usado. No fue perfecto y ciertamente me dejó con una sensación de malestar, pero hizo el trabajo que debería haber podido hacer. En comparación, ChatGPT Images con el nuevo modelo 1.5 marcó un gran avance para la empresa, pero no me sorprendió de la misma manera.

Dos imágenes editadas por IA de una familia en un campo de fútbol nevado están una al lado de la otra para comparar qué tan realista es un generador sobre el otro.

Gemini (izquierda) pudo hacer una versión más realista de mi familia en el estadio Kidd Brewer de la Universidad Estatal de los Apalaches, mientras que la de ChatGPT es claramente falsa con su nieve exagerada.

Creado por Katelyn Chedraoui usando Gemini y ChatGPT

Gemini genera imágenes más rápido que ChatGPT, y esas imágenes de Gemini tendieron a ser mejores en mis pruebas. También alcancé mi límite de generación con la versión gratuita de ChatGPT más rápido que con la versión gratuita de Gemini, lo cual fue molesto.

Un área en la que a ChatGPT le va bien es en el trabajo menos realista y más creativo. Las imágenes de IA de OpenAI se volvieron reconocibles por la forma en que se inclinaban hacia estilos de dibujos animados y un ligero tinte amarillo en algunas imágenes. El tinte amarillo ya no existe, pero el estilo de dibujos animados sigue siendo un lugar donde ChatGPT sobresale. Ciertamente tiene mucha experiencia con ello, ya que su primer modelo se volvió viral y la gente fabricó Al estilo Studio Ghibli versiones de sí mismos.

En el poco tiempo que llevo usando el nuevo modelo, pude ver hacia dónde se dirige OpenAI. Ya ha mostrado grandes mejoras, especialmente con texto y fotografía realista. Pero no puedo evitar preguntarme si este modelo 1.5 es una medida a medias para demostrar que puede competir con Google y que le esperan capacidades aún mejores en el modelo completo de segunda generación. Tendremos que esperar y ver. Por ahora, mi consejo sigue siendo el mismo: ChatGPT Images es excelente para los usuarios de ChatGPT, pero Nano Banana Pro es realmente excepcional.

Fuente