Gemini es el modelo más avanzado de IA que Google ha lanzado hasta la fecha. Tiene capacidad para procesar información en tiempo real tanto de dibujos como de texto. El la primera IA que supera a expertos humanos en comprensión masiva de lenguaje.
Ante el evidente éxito de ChatGPT, que ya va por su cuarta versión, Google se ha visto obligado a actuar. Por eso ya ha anunciado el lanzamiento de Gemini, su propia plataforma de Inteligencia Artificial multimodal. Tiene la capacidad de procesar y generar texto, como cualquier chatbot, códigos, imágenes, audio e incluso vídeo. Todo esto lo consigue a través de diferentes fuentes de datos, lo que le permite procesar diferentes fuentes de información. Además, han lanzado una versión compatible con el smartphone Google Pixel 8 Pro.
Gemini, creado para ser un modelo flexible y multimodal
Según Google, Gemini es el modelo más avanzado que han creado hasta la fecha. Se ha construido desde cero para ser multimodal, esto significa que puede generalizar y entender, operar y combinar a la perfección distintos tipos de información. Algún ejemplo de la información que puede procesar es texto, códigos de programación, audio, imágenes y vídeo.
Al ser entrenarla desde un inicio para que pueda combinar distintas modalidades de forma nativa hace que sea muy útil en algunos aspectos. Esto se traduce en que tiene la capacidad de procesar información en tiempo real tanto de dibujos como de textos. Incluso puede sugerir canciones con indicaciones previas.
También es el modelo más flexible que han hecho hasta ahora. Desde Google han conseguido que Gemini sea posible que funcione de forma eficaz desde cualquier parte, desde un centro de datos hasta en dispositivos móviles.
Pero, sin duda, el punto fuerte de Gemini es su capacidad de razonamiento. Gemini, en su versión Ultra, y según la empresa, es el primer modelo que supera a los expertos humanos en comprensión masiva del lenguaje multitarea. Utiliza una combinación de hasta 57 materias como matemáticas, física, historia, derecho, medicina y ética. Con esto se pone a prueba tanto el conocimiento del mundo como la capacidad de resolución de problemas.
Gemini ha puesto las expectativas realmente altas. Y es que ha destacado por superar a toda su competencia en los principales chats. Ahora sólo queda por ver cómo será la nueva versión de ChatGPT y en que posición deja a OpenAI.
En resumen, y comparándolo con ChatGPT, Gemini ha sido entrenado en un conjunto de datos masivos de texto e imágenes. Con esto puede percibir mucho mejor entorno y ofrecer unas respuestas mucho más precisas. Chat GPT, en cambio, sólo ha sido entrenado en texto.
Qué versiones va a lanzar Google
Google tiene previsto sacar tres modelos diferentes de Gemini. Estas son Gemini Ultra, Gemini Pro y Gemini Nano.
La versión Ultra será la más avanzado y estará disponible a partir de 2024. La Pro, en cambio, ya está disponible, mientras que la Nano se irá incorporando a los smartphone. Desde Google han asegurado que han realizado tres versiones para hacer más sostenible el uso de la Inteligencia Artificial Generativa.
La versión Pro es la idónea para razonamientos más avanzados, planificación y comprensión. Consiste en la mayor actualización de Google Bard. En cambio, Gemini Nano estará disponible en el Pixel 8 Pro. Será el primer smartphone diseñado para tener integrado Gemini Nano.
Gemini Nano puede realizar funciones como realizar resúmenes en la grabadora o elaborar respuestas inteligentes en formato textual.
Por último, Google, con Gemini Ultra está siendo tratado actualmente por clientes y desarrolladores para que esté operativo a comienzos del 2024.