Google presenta robots que piensan antes de actuar y buscan en internet

Google DeepMind lanza robots Gemini capaces de razonar, planear tareas y buscar en la web en tiempo real para adaptarse a nuevos entornos.
Google DeepMind presentó este martes sus modelos de IA más avanzados para robótica, bautizados como Gemini Robotics 1.5 y Gemini Robotics-ER 1.5. La novedad reside en que estos sistemas pueden “pensar” varios pasos por adelantado antes de ejecutar una acción física y, además, consultar información en línea en tiempo real para resolver problemas. En pruebas realizadas en San Francisco y Londres, los robots lograron clasificar basura según normativas locales y preparar una maleta con ropa adecuada al clima. Con ello, la compañía marca un punto de inflexión en el desarrollo de máquinas autónomas y adaptables, que ya no dependen de meses de programación para nuevas tareas.
Robots que razonan antes de actuar
El gran avance de esta generación se centra en el modelo Gemini Robotics-ER 1.5, donde “ER” significa embodied reasoning o razonamiento encarnado. A diferencia de los robots convencionales, que siguen instrucciones rígidas, este sistema es capaz de planificar mentalmente varios pasos antes de ejecutar un movimiento físico, lo que acerca su comportamiento al de los chatbots de texto más avanzados.
En una demostración, el robot recibió la orden de clasificar desechos según las normas de reciclaje locales. Primero identificó la ubicación de la prueba, en San Francisco, luego consultó en internet la normativa municipal de residuos y finalmente separó los objetos correctamente. En otro ejercicio, al ser instruido para preparar una maleta para un viaje a Londres, buscó el pronóstico del tiempo y añadió a la lista prendas adecuadas como un gorro de lana.
Carolina Parada, responsable de robótica en Google DeepMind, subrayó el cambio de paradigma: “Los robots actuales son altamente especializados y requieren meses de implementación. Nuestro enfoque generativo permite que afronten escenarios totalmente nuevos sin necesidad de reprogramación”.
Aprendizaje que cruza plataformas
Otro elemento transformador es la transferencia de tareas entre plataformas. El modelo ER se encarga del razonamiento y la planificación, mientras que Gemini Robotics 1.5 ejecuta las acciones físicas. Esto significa que lo aprendido en un robot puede replicarse en otro completamente distinto.
Durante la presentación, DeepMind mostró cómo tareas entrenadas en el robot de doble brazo ALOHA2 se trasladaron de forma fluida al brazo robótico Franka y al humanoide Apollo, desarrollado por Apptronik. Esta versatilidad acorta de manera drástica los tiempos de desarrollo industrial y abre la puerta a un ecosistema robótico más interconectado.
La compañía ya había anticipado esta visión con RoboBallet, un sistema presentado a principios de mes que coordina hasta ocho robots industriales con una eficiencia un 25% superior a los métodos tradicionales. Gemini, sin embargo, amplía el concepto al dotar a los robots de una capacidad de razonamiento autónomo y adaptable, acercándolos más a la noción de trabajadores universales en entornos cambiantes.
De la basura al futuro de la industria
Los ejemplos mostrados —clasificación de residuos y preparación de un viaje— pueden parecer simples, pero esconden un salto técnico monumental. En ambos casos, los robots no se limitaron a ejecutar instrucciones, sino que analizaron, buscaron información y tomaron decisiones. Esa habilidad los acerca a la autonomía funcional en entornos reales, un objetivo largamente perseguido por la robótica.
El acceso inicial al modelo de razonamiento ER se ha abierto a través de la API de Gemini, mientras que el modelo de acción física sigue limitado a socios estratégicos. El objetivo es acelerar la experimentación con aplicaciones potenciales que van desde la logística y la manufactura hasta la asistencia doméstica o sanitaria.
El impacto económico podría ser enorme. La robótica inteligente ya mueve miles de millones y, con sistemas capaces de adaptarse sin costosos procesos de programación, el umbral de entrada para industrias y startups se reduce drásticamente. En este sentido, Google busca liderar el sector frente a competidores como Boston Dynamics, Tesla o los proyectos de IA aplicada de Microsoft y Amazon.
Más allá de la automatización
Lo que está en juego no es solo un nuevo modelo de robot, sino la posibilidad de redefinir la relación entre humanos y máquinas. Robots que piensan, planean y buscan en internet pueden convertirse en colaboradores activos, no simples herramientas repetitivas. Sin embargo, este futuro plantea dilemas éticos y sociales: ¿qué ocurre cuando un robot puede acceder a información ilimitada en tiempo real y tomar decisiones en entornos críticos?
El lanzamiento de Gemini Robotics llega en un momento en que la IA vive una expansión acelerada hacia lo físico. Después de transformar la comunicación y la creatividad digital, el siguiente paso lógico es que los algoritmos se encarnen en máquinas que habiten fábricas, hogares y hospitales.
La frontera entre lo humano y lo artificial se hace cada vez más difusa. El reto será garantizar que estos robots no solo piensen y actúen, sino que lo hagan bajo principios de seguridad, transparencia y responsabilidad. Porque en la carrera por el futuro, la tecnología de Google marca un hito: los robots ya no esperan órdenes, se anticipan a nuestras necesidades y buscan respuestas por sí mismos.
Comentarios cerrados