Gemini, la apuesta de Google en Inteligencia Artificial ya es una realidad

Google ha hecho realidad su mayor apuesta en el mundo de la inteligencia artificial por todo lo grande y hoy ha presentado Gemini, el que se anuncia como el sistema más avanzado de inteligencia artificial multimodal, y con el que quiere marcar un nuevo hito en lo que muchos consideran el avance tecnológico más disruptivo de los últimos años.

¿Qué es Gemini y cómo funciona?

Gemini es el resultado de la colaboración de múltiples equipos de Google, quienes han conseguido crear el lenguaje de IA más capaz desarrollado por la compañía. Se trata de un modelo de IA multimodal, es decir que es capaz de entender y usar distintos formato de información, ya sea texto, audio, imágenes o video e incluso algunos lenguajes de código. Todo ello de forma nativa, lo que permite a Gemini una mayor versatilidad, flexibilidad y eficiencia que otros sistemas.

Otros sistemas entrenan la entrada de información multimodal de forma separada, lo que hace que mientras que pueden ser muy buenos en unas tareas, a la hora de trabajar con otras estas se les hicieran mas complicadas. Por ejemplo pueden ser muy buenas a la hora de describir y entender una imagen, pero no ser tan eficientes con el razonamiento conceptual, o viceversa. Gemini se ha diseñado desde un inicio para ser multimodal de forma nativa de forma que sea capaz de comprender y razonar sobre todo tipo de entrada de información.

Según Google esta forma de enfocar Gemini le permite ser mejor que los modelos multimodales ya existentes, hasta el punto de que es el primer modelo que supera a los expertos humanos en MMLU (Massive Multitask Language Understanding), método usado para probar el conocimiento y las capacidades de resolución de problemas de los modelos de IA.

Lanzado como la primera versión, Gemini 1.0 estará disponible en tres formatos: Gemini Ultra, el modelo más potente y de mayor tamaño pensado para tareas de gran complejidad, Gemini Pro, pensado para trabajar en una amplia gama de tareas y Gemini Nano, modelo destinado a ejecutar tareas directamente en el dispositivo.

¿Cuando y donde estará disponible Gemini?

En función del modelo, idioma y del publico destino, Gemini ya está disponible para ser probado, aunque hay modelos que tardarán un poco más en estarlo:

Para consumidores:

  • Bard con una versión afinada de Gemini Pro está disponible desde hoy en inglés en más de 170 países y territorios, lo que supone la mayor mejora de calidad de Bard desde su lanzamiento, con mejoras en el resumen, brainstorming, escritura y planificación.
  • En el Pixel 8 Pro, se está incluyendo para impulsar nuevas funciones como Resumir en la Grabadora y Respuesta Inteligente en Gboard.
  • En los próximos meses, estará disponible en más productos y servicios como Search, Ads, Chrome y Duet AI.

Para desarrolladores

  • A partir del 13 de diciembre, los desarrolladores y clientes (empresas) podrán acceder a Gemini Pro mediante la API de Gemini a través de Google AI Studio y Vertex AI.
    • Google AI Studio es una herramienta gratuita para desarrolladores basada en la web que ayuda a los desarrolladores y clientes empresariales a crear prototipos y lanzar aplicaciones rápidamente con una clave API;
    • Cuando es el momento de tener una plataforma de IA totalmente administrada, Vertex AI permite la personalización de Gemini con control total de datos y se beneficia de funciones adicionales de Google Cloud para seguridad empresarial, privacidad y gobernanza y cumplimiento de datos.
  • Los desarrolladores de Android también podrán crear con Gemini Nano, el modelo más eficiente para tareas en el dispositivo, a través de AICore. AICore es una nueva capacidad del sistema, disponible en Android 14, a partir de dispositivos Pixel 8 Pro. 
  • Gemini Ultra estará disponible a través de un programa de acceso anticipado para desarrolladores, socios y empresas seleccionadas, con el objetivo de recibir comentarios y mejores, antes de abrirlo a desarrolladores y empresas de manera más extendida a principios del año que viene.
  • A principios del próximo año, también lanzaran Bard Advanced, una nueva experiencia de IA de vanguardia que da acceso a nuestros mejores modelos y capacidades, comenzando con Gemini Ultra.
Hands-on with Google’s Gemini AI model

Este comienzo de nueva era en Google, como la compañía lo ha definido, está solo comenzando y nos advierten de que próximamente anunciarán nuevas versiones con mayores capacidades y avances para Gemini, el que ya se postula como el mayor competidor para ChatGPT.