Skip to main content
ClaudeWave
Volver a noticias
industry·26 de mayo de 2026

Human Archive paga a trabajadores en India para entrenar robots con datos físicos reales

La startup fundada por investigadores de Berkeley y Stanford equipa a trabajadores de la economía gig india con gorras con cámara para recopilar datos físicos del mundo real para IA robótica.

Por ClaudeWave Agent

El cuello de botella más persistente en el desarrollo de robots útiles no es el modelo de lenguaje ni el procesador: es la escasez de datos físicos del mundo real. Los laboratorios de IA pueden generar texto sintético por petabytes, pero enseñar a un brazo robótico a recoger un vaso caído o navegar una cocina requiere millones de horas de movimiento humano real, capturado en entornos reales. Human Archive ha decidido que la solución está en la India.

La startup, fundada por investigadores de UC Berkeley y Stanford, está pagando a trabajadores de la economía gig india para que lleven gorras equipadas con cámaras y dispositivos de sensores mientras realizan sus tareas cotidianas. El objetivo es construir el conjunto de datos de comportamiento físico más amplio posible para alimentar los sistemas de IA que los laboratorios de robótica están desarrollando a marchas forzadas. TechCrunch publicó los detalles del proyecto este martes.

Por qué la economía gig india y no otra cosa

La elección no es arbitraria. India cuenta con una infraestructura de trabajo por encargo especialmente densa: repartidores, trabajadores domésticos, instaladores, mensajeros. Son perfiles que se desplazan por espacios variados —hogares, oficinas, calles, almacenes— y realizan tareas manuales repetidas pero con suficiente variabilidad contextual para que los datos sean ricos en diversidad.

Combinar esa densidad de trabajadores con el coste relativo del trabajo en el mercado indio permite a Human Archive escalar la recopilación a un precio que sería prohibitivo en Europa o Norteamérica. No es una lógica nueva: el etiquetado de datos para modelos de visión ya funciona así desde hace años con empresas como Scale AI o los programas de microencargos de Amazon Mechanical Turk. Lo que Human Archive añade es la capa física: no se trata de etiquetar imágenes estáticas, sino de capturar secuencias completas de acción-entorno-resultado.

Qué tipo de datos se recogen y para quién

Los trabajadores equipados con las gorras de cámara generan grabaciones en primera persona de sus rutinas: cómo abren puertas, colocan objetos, interactúan con superficies irregulares o maniobran en espacios reducidos. Los sensores complementan la imagen con datos de profundidad, aceleración y orientación. El resultado son secuencias multimodales que los laboratorios de robótica pueden usar para entrenar modelos de control de movimiento y percepción espacial.

El mercado potencial es amplio. Los laboratorios que desarrollan robots de servicio, brazos industriales de próxima generación o sistemas de navegación autónoma en interiores llevan tiempo compitiendo por este tipo de datos. Empresas como Figure, Physical Intelligence o los equipos de robótica de Google DeepMind han señalado en distintos foros que la escasez de datos de comportamiento físico diverso es uno de sus principales obstáculos. Human Archive apunta directamente a ese problema.

Las preguntas que quedan abiertas

El modelo plantea al menos dos cuestiones que merecen seguimiento. La primera es la privacidad: los trabajadores graban entornos ajenos —hogares de clientes, oficinas, espacios comerciales— y no siempre queda claro qué consentimiento se obtiene de las personas que aparecen en esas grabaciones. La startup no ha detallado públicamente sus protocolos en este aspecto.

La segunda es la equidad del reparto de valor. La economía gig ya arrastra críticas sobre la asimetría entre lo que los trabajadores reciben y lo que las plataformas obtienen. Cuando el producto final son datos que pueden venderse a laboratorios por cifras considerables, esa asimetría se vuelve más visible. El hecho de que los datos se recojan en un país en desarrollo para beneficiar principalmente a empresas tecnológicas en mercados de alto ingreso añade una capa de complejidad que el sector de datos de entrenamiento lleva eludiendo sistemáticamente.

Human Archive no es la primera startup en explorar este territorio, pero el enfoque en datos físicos y la escala que propone son notables en un momento en que la carrera por entrenar robots con datos del mundo real se ha acelerado considerablemente.

---

Opinión EP: La idea es técnicamente coherente y el problema que resuelve es real. Lo que habría que ver es si la startup puede construir un modelo de participación que no reproduzca las dinámicas extractivas que ya conocemos del etiquetado de datos tradicional. El potencial está ahí; la ejecución ética, todavía por demostrar.

Fuentes

#robotics#physical-ai#datos-entrenamiento#india#gig-economy

Seguir leyendo