El espacio de la inteligencia artificial generativa (IA) sigue calentándose, pues OpenAI ha presentado GPT-4V, un modelo con capacidad de visión, y modos conversacionales multimodales para su sistema ChatGPT.
Por: CoinTelegraph
Con estas nuevas mejoras, anunciadas el 25 de septiembre, los usuarios de ChatGPT podrán entablar conversaciones con él. Los modelos de ChatGPT, GPT-3.5 y GPT-4, ahora pueden entender consultas en lenguaje llano y responder con una de las cinco voces disponibles.
Según una entrada del blog de OpenAI, esta nueva interfaz multimodal permitirá a los usuarios interactuar con ChatGPT de formas novedosas:
“Haz una foto de un monumento mientras viajas y mantén una conversación en tiempo real sobre lo que te parece interesante. Cuando estés en casa, haz fotos de la nevera y la despensa para saber qué hay para cenar (y haz preguntas de seguimiento para obtener una receta paso a paso). Después de cenar, ayuda a tu hijo con un problema de matemáticas haciendo una foto, rodeando con un círculo el conjunto de problemas y haciendo que comparta pistas con los dos”.
Puedes leer la nota completa en CoinTelegraph