En marzo, mientras estaba prueba y revisión En la primera iteración del modelo de imagen de OpenAI, le di al chatbot lo que pensé que sería una prueba sencilla: hazme una infografía que explique el ciclo del agua. Esa prueba terminó siendo una especie de desastre. Entonces, cuando OpenAI anunciado su nuevo modelo 1.5 y su interfaz de Imágenes ChatGPT, estaba listo para darle otra oportunidad. Lamentablemente, lo que encontré fue emblemático del progreso y los problemas persistentes con los medios generativos en 2025.
Quédate conmigo un minuto y recuerda cuándo aprendiste por primera vez sobre el ciclo del agua. Para mí, fue en la escuela primaria y teníamos una canción que rimaba para ayudarnos a recordar cómo se transforma el agua en el medio ambiente, desde el vapor de agua hasta las nubes y la lluvia. Recuerdo vívidamente haber visto en clase diferentes imágenes y vídeos que explicaban las diferentes fases.
Entonces, para una empresa que dice que el GPT-5 de su chatbot es tan inteligente como un doctorado., ¿por qué sus modelos de imágenes no pueden representar un gráfico simple de uno de los procesos geológicos más básicos (o deberíamos decir, elementales) y mejor documentados?
(Divulgación: Ziff Davis, la empresa matriz de CNET, presentó en abril una demanda contra OpenAI, alegando que infringió los derechos de autor de Ziff Davis al entrenar y operar sus sistemas de IA).
Esto ha mejorado mucho para ChatGPT, pero aún no es perfecto. Las flechas no apuntan en la dirección correcta.
Si tuviera que defender ChatGPT, señalaría que esta infografía más reciente es mucho mejor que las versiones anteriores. El texto finalmente es legible, un gran paso adelante incluso desde hace un mes. Incluía todas las fases y sus fuentes, según lo solicitado. Pero las flechas todavía están equivocadas, ya que la flecha vertical de la precipitación da la impresión de que la lluvia puede volar hacia arriba desde el suelo. Le pregunté tres veces más después del fracaso inicial y los resultados fueron prácticamente idénticos.
Con el modelo de imagen original de OpenAI, me llevó más de 20 indicaciones y 2 horas crearlo. Todavía hay errores.
Estoy seguro de que nadie que utilice la nueva función Imágenes ChatGPT está tan interesado como yo en su capacidad para representar correctamente el ciclo del agua. Quizás estoy siendo demasiado exigente. Pero el problema resalta un problema constante con OpenAI: puede que tenga uno de los chatbots más utilizados, pero sus servicios creativos dejan mucho que desear. Eso no solía ser un gran problema, hasta que Google cambió las reglas del juego este verano.
Esta tarjeta navideña creada por ChatGPT conserva bastante bien los rasgos de mis amigos y los míos de la foto original (izquierda), pero nuestra piel aún tiene ese aspecto brillante de IA.
Imágenes ChatGPT de OpenAI frente a Nano Banana de Google
OpenAI y Google han estado compitiendo a lo largo de 2025 en la carrera por la IA más avanzada. Google, en su mayor parte, ha tomado la delantera, pero OpenAI nunca se ha quedado atrás. Cuando Google eliminó los modelos de imágenes y videos líderes en la industria, como Veo 3 y nanoplátanoOpenAI seguiría unas semanas más tarde con sora y ahora Imagen 1.5. Este modelo de imagen en particular, junto con GPT 5.2es probablemente el resultado de un “código rojo” interno que OpenAI supuestamente emitió debido a la preocupación por la destreza técnica que Google mostró con su reciente familia de modelos en Géminis 3.
En otras palabras, las dos principales empresas de tecnología, aunque tradicionalmente no son conocidas por su historia creativa, han estado invirtiendo fuertemente en IA creativa. Ha conducido a avances técnicos masivos, y muchas preocupaciones.
Las imágenes de ChatGPT (derecha) se han mejorado con respecto a las versiones anteriores, pero no engañan a nadie como lo son las imágenes de IA de Gemini (izquierda).
Nano Banana Pro de Google es nuestro recientemente coronado mejor generador de imágenes de IA de 2025, y fue uno de los programas de IA más impresionantes e inspiradores que he usado. No fue perfecto y ciertamente me dejó con una sensación de malestar, pero hizo el trabajo que debería haber podido hacer. En comparación, ChatGPT Images con el nuevo modelo 1.5 marcó un gran avance para la empresa, pero no me sorprendió de la misma manera.
Gemini (izquierda) pudo hacer una versión más realista de mi familia en el estadio Kidd Brewer de la Universidad Estatal de los Apalaches, mientras que la de ChatGPT es claramente falsa con su nieve exagerada.
Gemini genera imágenes más rápido que ChatGPT, y esas imágenes de Gemini tendieron a ser mejores en mis pruebas. También alcancé mi límite de generación con la versión gratuita de ChatGPT más rápido que con la versión gratuita de Gemini, lo cual fue molesto.
Un área en la que a ChatGPT le va bien es en el trabajo menos realista y más creativo. Las imágenes de IA de OpenAI se volvieron reconocibles por la forma en que se inclinaban hacia estilos de dibujos animados y un ligero tinte amarillo en algunas imágenes. El tinte amarillo ya no existe, pero el estilo de dibujos animados sigue siendo un lugar donde ChatGPT sobresale. Ciertamente tiene mucha experiencia con ello, ya que su primer modelo se volvió viral y la gente fabricó Al estilo Studio Ghibli versiones de sí mismos.
En el poco tiempo que llevo usando el nuevo modelo, pude ver hacia dónde se dirige OpenAI. Ya ha mostrado grandes mejoras, especialmente con texto y fotografía realista. Pero no puedo evitar preguntarme si este modelo 1.5 es una medida a medias para demostrar que puede competir con Google y que le esperan capacidades aún mejores en el modelo completo de segunda generación. Tendremos que esperar y ver. Por ahora, mi consejo sigue siendo el mismo: ChatGPT Images es excelente para los usuarios de ChatGPT, pero Nano Banana Pro es realmente excepcional.





