Gemini Robotics, la IA de Google para traer robots más listos a nuestras vidas

13 marzo, 2025

Si bien la inteligencia artificial está cada vez más presente en nuestras vidas, lo hace casi siempre desde un plano digital. Es decir, que apenas lo vemos en el plano físico de la vida real y mucho menos interactuando en el día a día de la mayoría de personas. Esto es algo que Google quiere cambiar de la mano de DeepMind, quienes sobre la base de Gemini 2.0 acaba de presentar Gemini Robotics, un nuevo proyecto con el que Google quiere llevar la IA al mundo físico a través de la robótica.

Gemini Robotics, la IA de Google para traer robots más listos a nuestras vidas

Robots más diestros y adaptables

En nuestro paso por el MWC25, os hemos ido enseñando diversos dispositivos que allí hemos podido ver relacionados con la IA, desde funciones para móviles hasta sistemas de traducción. Sin embargo lo que más llamó la atención en este aspecto fueron los robots, los cuales pudimos ver con un aspecto cada vez mas humano e incluso en modelos más asequibles con los que democratizar su introducción en la vida real.

Google es muy consciente del papel que la robótica tendrá en nuestras vida y sabe que esta no llegará a ningún lado sin una IA adaptada para ellos. Fruto de este conocimiento nos llega Gemini Robotics, un proyecto con el que se busca integrar la inteligencia artificial en robots físicos, de forma que estos puedan realizar tareas complejas en el mundo real. La idea es ofrecer una IA que permita a los robots tanto aprender, como a adaptarse a entornos dinámicos y no estructurados de forma que, en base a sus propias experiencias, vayan mejorando su funcionamiento con el paso del tiempo.

En este proyecto Google ha usado el modelo visión-lenguaje-acción más avanzado de su arsenal. Quieren diseñar un sistema basado en tres aspectos fundamentales: debe ser general de forma que se adapte a diferentes situaciones, tiene que ser interactivos para entender y responder rápidamente a instrucciones o cambios en su entorno y deber ser diestros, lo que viene a significar que debes ser capaces de realizar el tipo de cosas que las personas normalmente hacemos con las manos y dedos. Vamos que la IA de Gemini Robotic quiere lograr que los robots sean capaces de desempeñarse de forma eficiente ante situaciones novedosas, incluso ante aquellas para las que no han recibido entrenamiento.

Como explican desde Google, para poder desenvolverse en el mundo físico los robots deberán de ser capaces de interactuar con personas y el entorno, por lo que deben ser interactivos. Para ello Gemini Robotics aprovechará las capacidades avanzadas de comprensión del lenguaje de Gemini para permitir que sean capaces de comprender y responder ante ordenes o peticiones en lenguaje cotidiano y en diferentes idiomas.

Moverse en el mundo real implicará que los robots sean capaces de interactuar con él con destreza, lo que lleva aparejado que tengan habilidades motores tan complejas como las que un humano realizar con sus manos. No solo es ser capaz de hacer un movimiento, sino de saber que fuerza aplicar o como manipular un objeto.

Por supuesto las capacidades variarán en función del diseño del robot y es que si bien Google ha estado entrenando su sistema utilizando principalmente la plataforma robótica bibrazo ALOHA 2, esta puede adaptarse o modelos humanoides como el robot humanoide Apollo desarrollado por Apptronik.

Todo esto no se basará solo en Gemini ya que necesitará un enfoque más especializado. Para ello Google ha desarrollado un nuevo modelo avanzado de visión y lenguaje al que han llamado Gemini Robotics-ER, en referencia a la abreviatura de «embodied reasoning», es decir «razonamiento incorporado» en inglés. Este modelo mejora capacidades especificas que van a necesitar los robots como la detección 3D y el apuntado, lo que les permitirá ser capaces de localizar un objeto, definirlo en 3D, identificarlo y saber como agarrarlo correctamente.

Piensa en las cosas que hacemos de forma diaria con las manos, en la cantidad de objetos que cogemos y las variantes que tenemos en cuenta para hacerlo. Aspectos como la forma, la distancia, el estado de un objeto, su composición o la estimación espacial son aspectos que Gemini Robotics-ER tratará de hacer accesibles para los robots.

Uno de los puntos más importantes de este proyecto es la seguridad, tanto de los propios robots, como sobre todo de los humanos que con ellos interactúen. A las habituales medidas de seguridad de un robot, como el evitar que choquen contra objetos, que se caigan o que apliquen la fuerza correcta en cada situación, Gemini Robotics-ER quiere asegurarse de que el robot es capaz de reconocer las implicaciones de seguridad que tendrían una acción determinada, tanto para él mismo, como sobre todo para las personas y objetos que se puedan ver afectados.

Todo aficionado a la ciencia ficción conoce Las tres Leyes de la Robótica de Isaac Asimov (cuatro si contamos la ley Zero que añadió décadas después). Si bien estás sirvieron como base, Google está impulsando la adopción de una serie de marcos donde se busca conseguir una serie de medidas que rijan las implicaciones de seguridad de las acciones robóticas en su interacción en el mundo real.

Imágenes de Google y Apptronik

Artículo anterior

Los nuevos Roborock Qrevo ya están disponibles en España

Artículo siguiente

OnePlus 13, diseño y rendimiento con el potente Snapdragon 8 Elite – Análisis

Gemini Robotics, la IA de Google para traer robots más listos a nuestras vidas

Robots más diestros y adaptables

Nota

Artículos relacionados

Análisis

OMODA 9 SHS, una semana con un SUV de 537 CV con etiqueta CERO – Análisis

Huawei Watch Fit 5 a fondo: el deporte con estilo y una batería que no se acaba – Análisis

Mi experiencia tras probar la nueva Alexa+ (y por qué ya no le grito al altavoz)

Plaud NotePin S: transcripción y resúmenes inteligentes para «llevar puesto» – Análisis

Garmin Fenix 8 Pro: un mes sin quitármelo desde Madrid a Japón y esta es mi opinión – Análisis

Honor 600, análisis a fondo: Lo mejor, lo peor y lo que nadie te cuenta

Gadgets

El Google Pixel 9a al descubierto. Se filtran sus especificaciones y precios

DeepCool ASSASSIN IV VC VISION – Análisis y opinión

Intel Core Ultra 9 285K – Análisis y opinión