La empresa OpenAI, una de las más importantes en Inteligencia Artificial, ya ha lanzado la nueva versión de su famoso chatbot, Chat GPT-4o. En esta ocasión llega con mejoras de velocidad de respuesta y traducciones en tiempo real.
Ahora OpenAi ha ido más allá para que la interacción con el bot de Chat GPT-4o sea aún más enriquecedora. Permite cualquier tipo de combinación de texto, audio e imagen, pero, además, también genera contenido más allá del texto incluyendo el audio y la imagen. Será un modelo muy accesible ya que estará disponible para cualquier tipo de usuarios, ya tengan una membresía gratuita o de pago, por lo que podrá ser utilizado por cualquier persona. Presenta interesantes mejoras como traducciones simultáneas, mayor velocidad de respuesta o interpretar archivos en formato de imagen o video.
Qué novedades presenta la última versión de OpenAI
Uno de los objetivos que ha perseguido OpenAI es mejorar la experiencia de usuario. Es decir, intentar que la interacción que se tiene con una Inteligencia Artificial sea cada vez más parecida a la que se tiene con un humano.
Todo esto pasa porque la comunicación sea mucho más fluida entre IA y humano. Por ejemplo, una de las barreras más grandes que tiene cualquier bot es su dificultad para poder detectar emociones. Para ello, OpenAI, en su acto de presentación, mostró como la propia IA de Chat GPT-4o detectó a un usuario nervioso, a lo que le recomendó haces respiraciones profundas.
No sólo detecta las emociones a través de una descripción, sino que a través de la cámara del smartphone puede leer los rostros de las personas y asociarlos a emociones. De esta forma puede ser una gran ayuda ya que permite guiar en ejercicios de respiración o contar una historia para calmar a la persona en cuestión.
Otra características que han corregido es que al chatbot ahora se le puede interrumpir. Antes se le podía detener en el proceso en el que estaba enviando la respuesta pero tardaba un poco en reaccionar. Con esta nueva versión se puede reconducir la conversación de forma inmediata. De esta forma, el retardo de las respuestas se ha reducido notablemente haciendo que la comunicación con el bot sea mucho más rápida.
De lo más llamativo es que Chat GPT-4o permite realizar traducciones simultáneas en más de 50 idiomas e incluso plantearle un problema matemático complejo.
Chat GPT-4o, procesamiento multimodal
Con Chat GPT-4o han conseguido implementar un procesamiento multimodal. Esto significa que va a entender lo que se le escriba por texto e incluso que pueda interpretar la información que se le envíe en una imagen, audio o vídeo. Esto hace que la interacción con la IA sea mucho más enriquecedora.
Como se ha mencionado anteriormente, una de las mayores novedades de Chat GPT-4o es mejorar su interacción hasta el punto de que se asemeje a una persona. Debido a esto, Chat GPT-4o presenta la gran novedad de tener distintos tonos de voz, hasta el punto de poder reír o cantar. Esta parte es lo verdaderamente clave para que la interacción con el chatbot pueda asemejarse a la comunicación que se tiene con otro ser humano.
Aun así, es importante mencionar que pese a las funciones tan llamativas que presenta Chat GPT-4o, las interacciones están limitadas a un número determinado por hora. Para superar esta barrera hay que suscribirse a Chat GPT Plus, además de que al pagar serán los primeros en recibir las últimas novedades. Para hacerse miembro premium de OpenAI hay que pagar un precio de 20 dólares mensuales.
A pesar de la democratización de varias funciones, ChatGPT Plus sigue teniendo sus privilegios. Los suscriptores tienen acceso a un número mayor de interacciones por hora. A menudo son los primeros en experimentar las novedades, como la reciente actualización que incluye un modo de voz avanzado.