La IA de ChatGPT 2.0 Ahora Genera Manga, Imágenes Realistas y Razona como Humano

Notícias Portuguesas » La IA de ChatGPT 2.0 Ahora Genera Manga, Imágenes Realistas y Razona como Humano
Preview La IA de ChatGPT 2.0 Ahora Genera Manga, Imágenes Realistas y Razona como Humano

OpenAI ha lanzado ChatGPT Images 2.0, su más reciente modelo para la generación de imágenes. Esta actualización representa un avance significativo, superando las limitaciones técnicas de su predecesor y dotando a la IA de capacidades de razonamiento profundo, comparables a los modelos de la serie O.

La principal innovación de ChatGPT Images 2.0, según OpenAI, radica en su método de generación: la IA ahora investiga y planifica la estructura de la imagen antes de proceder a la renderización. Esta nueva arquitectura permite manejar bloques de texto extensos, infografías y mapas con una precisión sin precedentes.

Entre sus nuevas funciones, ChatGPT Images 2.0 puede generar texto legible en diversos idiomas, como japonés, coreano y chino. Los usuarios podrán crear infografías, mapas, interfaces gráficas e incluso contenido de manga. OpenAI enfatiza que las imágenes generadas deben funcionar como un lenguaje visual capaz de organizar y comunicar información compleja, no solo como elementos decorativos.

La IA demuestra una notable capacidad para mantener la continuidad de personajes y objetos a través de diferentes ángulos y contextos, preservando su identidad. Esta coherencia se logra gracias a una arquitectura que maneja razonamiento espacial complejo y perspectivas en 3D, respondiendo a instrucciones sencillas.

ChatGPT Images 2.0 ‘piensa’ antes de generar una imagen

El nuevo modo de “Pensamiento” permite al sistema no solo dibujar a partir de un texto, sino también analizar materiales proporcionados por el usuario, como presentaciones de PowerPoint o documentos de estrategia corporativa. ChatGPT Images 2.0 identifica jerarquías de datos, logotipos y estilos específicos para transformar esta información en carteles o materiales internos, manteniendo la precisión del contenido original.

Este modo de Pensamiento es similar a la experiencia de ChatGPT, donde el modelo puede tardar más en responder debido a un análisis profundo de diseño, materiales y objetos. En contraste, el modelo base responde más rápidamente y sigue instrucciones precisas para ofrecer resultados finales listos para su implementación.

Otra característica destacada de ChatGPT Images 2.0 es su precisión tipográfica. El manejo del texto ha sido históricamente un punto débil en la generación de imágenes por IA. OpenAI afirma que su modelo soporta distintos alfabetos y puede crear diagramas científicos o mapas históricos con texto completamente legible y frases gramaticalmente correctas.

Según informes, OpenAI ha estado probando ChatGPT Images 2.0 bajo el nombre clave ‘duct tape’. Las primeras pruebas confirmaron su capacidad para replicar interfaces de usuario y capturas de pantalla de sitios web conocidos con un realismo extremo. Además, el modelo puede realizar búsquedas web en tiempo real para asegurar que los elementos visuales estén actualizados.

ChatGPT Images 2.0 ya está disponible para todos los usuarios

ChatGPT Images 2.0 se ofrece bajo tres modalidades de acceso. Los usuarios con cuentas gratuitas tienen acceso al modelo base. Los suscriptores Plus y Pro obtienen herramientas de razonamiento, búsqueda web y la capacidad de crear múltiples imágenes. Los desarrolladores con acceso a la API gpt-image-2 pueden generar imágenes en resolución 4K con diversas relaciones de aspecto.

OpenAI ha implementado protocolos de seguridad, incluyendo marcas de agua, filtros y políticas contra contenido dañino o abusivo. Es probable que ChatGPT Images 2.0 incluya restricciones para prevenir la generación de contenido protegido por derechos de autor. Por ejemplo, la creación de manga específico de series conocidas podría requerir enfoques alternativos para evitar bloqueos.