La IA nos acerca al sueño de los robots domésticos útiles

La IA nos acerca al sueño de los robots domésticos útiles

El santo grial de la robótica desde el inicio del campo ha sido construir un robot que pueda realizar nuestras tareas domésticas. Pero durante mucho tiempo eso ha sido sólo un sueño. Si bien los expertos en robótica han logrado que los robots hagan cosas impresionantes en el laboratorio, como el parkour, esto generalmente requiere una planificación meticulosa en un entorno estrictamente controlado. Esto dificulta que los robots funcionen de manera confiable en hogares donde hay niños y mascotas, las casas tienen planos de planta muy variables y contienen todo tipo de desorden.

Hay una observación muy conocida entre los robóticos llamada la paradoja de Moravec: lo que es difícil para los humanos es fácil para las máquinas, y lo que es fácil para los humanos es difícil para las máquinas. Gracias a la IA, esto ahora está cambiando. Los robots empiezan a ser capaces de realizar tareas como doblar la ropa, cocinar y descargar cestas de la compra, que no hace mucho se consideraban tareas casi imposibles.
 
Aquí hay tres razones por las que la robótica está a punto de tener su propio «momento ChatGPT».
 
1. El hardware barato hace que la investigación sea más accesible
Los robots son caros. Los robots altamente sofisticados pueden costar fácilmente cientos de miles de dólares, lo que los hace inaccesibles para la mayoría de los investigadores. Por ejemplo, el PR2, una de las primeras versiones de robots domésticos, pesaba 200 kilogramos y costaba 400.000 dólares.
 
Pero robots nuevos y más baratos están permitiendo que más investigadores hagan cosas interesantes. Un nuevo robot llamado Stretch, desarrollado por la startup Hello Robot, se lanzó durante la pandemia con un precio mucho más razonable de alrededor de 18.000 dólares y un peso de 23 Kgs. Tiene una pequeña base móvil, un palo del que cuelga una cámara, un brazo ajustable con una pinza con ventosas en los extremos y se puede controlar con un controlador de consola.
 
Mientras tanto, un equipo de Stanford ha construido un sistema llamado Mobile ALOHA (un acrónimo informal de “un sistema de teleoperación de hardware de código abierto y de bajo costo”), que aprendió a cocinar camarones con la ayuda de sólo 20 demostraciones humanas y datos de otras tareas. Utilizaron componentes disponibles en el mercado para improvisar robots con precios más razonables de decenas, no cientos, de miles.
 
Los primeros signos muestran que una mayor cantidad de datos está dando lugar a robots más inteligentes. Los investigadores construyeron dos versiones de un modelo para robots, llamado RT-X, que podían ejecutarse localmente en las computadoras de los laboratorios individuales o acceder a través de la web. El modelo más grande, accesible desde la web, fue entrenado previamente con datos de Internet para desarrollar un «sentido común visual», o una comprensión básica del mundo, a partir de los grandes modelos de lenguaje e imagen. Cuando los investigadores ejecutaron el modelo RT-X en muchos robots diferentes, descubrieron que los robots podían aprender habilidades con un 50% más de éxito que en los sistemas que cada laboratorio estaba desarrollando.
 
Play Video

2. La IA nos está ayudando a construir “cerebros robóticos”
Lo que diferencia a esta nueva generación de robots es su software. Gracias al auge de la IA, ahora la atención se está desplazando de las hazañas de destreza física logradas por robots costosos a la construcción de “cerebros de robots de uso general” en forma de redes neuronales. En lugar de la tradicional y minuciosa planificación y capacitación, los robóticos han comenzado a utilizar el aprendizaje profundo y las redes neuronales para crear sistemas que aprenden de su entorno sobre la marcha y ajustan su comportamiento en consecuencia. 

El verano pasado, Google lanzó un modelo de visión, lenguaje y acción llamado RT-2. Este modelo obtiene su comprensión general del mundo a partir del texto y las imágenes en línea con los que ha sido entrenado, así como de sus propias interacciones. Traduce esos datos en acciones robóticas. 

Y los investigadores del Instituto de Investigación Toyota, la Universidad de Columbia y el MIT han podido enseñar rápidamente a los robots a realizar muchas tareas nuevas con la ayuda de una técnica de aprendizaje de IA llamada aprendizaje por imitación, además de IA generativa. Creen haber encontrado una manera de extender la tecnología que impulsa la IA generativa desde el ámbito del texto, las imágenes y los vídeos al dominio de los movimientos de los robots. 

Muchos otros también han aprovechado la IA generativa. Covariant, una startup de robótica que surgió de la ahora cerrada unidad de investigación de robótica de OpenAI, ha construido un modelo multimodal llamado RFM-1. Puede aceptar indicaciones en forma de texto, imagen, vídeo, instrucciones del robot o medidas. La IA generativa permite que el robot comprenda instrucciones y genere imágenes o videos relacionados con esas tareas. 

3. Más datos permiten a los robots aprender más habilidades
El poder de los grandes modelos de IA, como el GPT-4, reside en las montones y montones de datos extraídos de Internet. Pero eso realmente no funciona para los robots, que necesitan datos recopilados específicamente para robots. Necesitan demostraciones físicas de cómo se abren las lavadoras y los frigoríficos, cómo se recogen los platos o se dobla la ropa. En este momento, esos datos son muy escasos y a los humanos les lleva mucho tiempo recopilarlos.

Una nueva iniciativa iniciada por Google DeepMind, llamada Open X-Embodiment Collaboration, tiene como objetivo cambiar eso. El año pasado, la empresa se asoció con 34 laboratorios de investigación y alrededor de 150 investigadores para recopilar datos de 22 robots diferentes, incluido Hello Robot’s Stretch. El conjunto de datos resultante, que se publicó en octubre de 2023, consta de robots que demuestran 527 habilidades, como recoger, empujar y moverse. 

 

 

 

Pequeños pasos

A pesar del rápido ritmo de desarrollo, los robots todavía enfrentan muchos desafíos antes de que puedan ser lanzados al mundo real. Todavía son demasiado torpes para que los consumidores habituales justifiquen gastar decenas de miles de dólares en ellos. Los robots también carecen todavía del tipo de sentido común que les permitiría realizar múltiples tareas. Y necesitan pasar de simplemente recoger cosas y colocarlas en algún lugar a juntarlas, por ejemplo, volver a colocar una baraja de cartas o un juego de mesa en su caja y luego en el armario de juegos. 

Pero a juzgar por los primeros resultados de la integración de la IA en los robots, los expertos en robótica no están perdiendo el tiempo.

Seguramente veremos algo parecido a un robot doméstico de uso general. Ahora bien, ¿será accesible al público en general?  En términos de inteligencia bruta, ya estamos viendo señales en este momento. 

La construcción de la próxima generación de robots podría no sólo ayudar a los humanos en sus tareas cotidianas o ayudar a personas a vivir una vida más independiente.

La robótica doméstica ofrece uno de los mejores puntos de referencia para la inteligencia artificial a nivel humano, afirma. El hecho de que un ser humano pueda operar de forma inteligente en el entorno doméstico, añade, significa que sabemos que es un nivel de inteligencia que se puede alcanzar. 

 

Fuente: The Algorithm