Coletar dados de treinamento para robôs é trabalho sujo e sem glamour. Alguns laboratórios de inteligência artificial já estão pagando XDOF para fazê-lo

TecnologiaPublicado em 17/06/2026
Se a IA física vai igualar os feitos dos LLMs, há um problema de dados que precisa ser resolvido.
Collecting robot training data is dirty, unglamorous work. Some AI labs are already paying XDOF to do it

Collecting robot training data is dirty, unglamorous work. Some AI labs are already paying XDOF to do it

Duas semanas atrás, a OpenAI anunciou que vai relançar o programa de robótica que havia encerrado em 2021 — mais um sinal de que os maiores laboratórios de IA estão correndo para ensinar máquinas a operar no mundo físico. Mas construir robôs capazes exige algo que a indústria de IA ainda não possui: dados de treinamento comparáveis aos usados em modelos de linguagem.

Essa lacuna está criando um novo tipo de negócio de infraestrutura. Diferentemente dos grandes modelos de linguagem (LLMs), que foram treinados com uma vasta quantidade de texto disponível publicamente, os robôs precisam de dados que capturem interações físicas — e esse tipo de dado praticamente não existe. Vídeos do YouTube e imagens capturadas por trabalhadores freelancers têm baixa fidelidade e são difíceis de alinhar com o mundo real.

A XDOF (pronuncia-se “éx-dóf”), que está saindo do modo stealth hoje, aposta que o próximo grande gargalo da IA não são modelos nem chips, mas o ciclo de feedback de dados necessário para ensinar robôs a interagir com o mundo físico.

A startup pretende construir os pipelines de dados, ferramentas de coleta e sistemas de anotação que laboratórios de ponta e empresas de robótica não conseguem desenvolver facilmente por conta própria — e já levantou US$ 70 milhões com investidores como Thrive Capital, Spark Capital, a16z, Lux e WndrCo. O cofundador e CEO Philippe Wu afirma que a XDOF, que conta com cerca de 60 funcionários, já trabalha com 20 clientes, incluindo vários laboratórios de IA de ponta, mas não pode revelar seus nomes.

“Todos os principais laboratórios estão tentando avançar em robótica”, disse Wu. “Já vimos as consequências de ficar um pouco atrás na corrida dos modelos de linguagem… ninguém quer ficar nessa situação, onde você investe tarde demais nessa tecnologia. Hoje, todos veem a IA física como a próxima fronteira.”

Wu enfrentou esse problema pessoalmente durante seu doutorado em Berkeley. Seu foco era permitir que robôs aprendessem habilidades a partir de grandes conjuntos de dados — mas havia um problema fundamental.

“Não tínhamos dados em grande escala para trabalhar”, disse ele. “Era um clássico problema de ‘ovo e galinha’: primeiro precisávamos coletar dados antes mesmo de pensar em como treinar um modelo de base para robótica.”

Wu e seu futuro cofundador e CTO da XDOF, Fred Shentu, trabalharam em um projeto chamado GELLO — um sistema de teleoperação de baixo custo que permite a um humano controlar um braço robótico para gerar dados de treinamento.

“Acabou se tornando um trabalho muito influente na área de robótica, porque muitas pessoas tinham os mesmos gargalos e começaram a usar esse tipo de dispositivo para coleta de dados”, disse Wu.

Ao perceber a oportunidade, Wu, Shentu e o terceiro cofundador e COO Nemo Jin lançaram a XDOF em outubro de 2024 para fornecer um ecossistema de dados para empresas que desenvolvem modelos de robótica. Cientes de que apenas fornecer dados pode ser um negócio limitado, a empresa também foca em limpeza de dados, ferramentas e anotação — criando um ciclo de feedback contínuo para o treinamento de robôs.

Como ponto de partida, a empresa fez parceria com o laboratório de IA da UC Berkeley para lançar o que acredita ser o maior conjunto de dados de alta qualidade para treinamento de robôs já reunido, chamado ABC. Ele inclui 130.000 trajetórias de manipulação robótica, 300 horas de simulações e 100 horas de avaliações. Esse tipo de dados de pré-treinamento em larga escala nunca esteve disponível antes para a academia.

“Já vimos em linguagem, geração de imagens e outros campos que, quando modelos e dados são disponibilizados, a comunidade consegue alcançar resultados surpreendentes”, disse David McAllister, doutorando em Berkeley que ajudou a organizar o projeto.

A equipe já utilizou esses dados para treinar robôs em tarefas como dobrar camisetas, achatar caixas e colocar AirPods em seus estojos.

Graus de liberdade ilimitados

A empresa planeja trabalhar em três níveis de uma pirâmide de dados. O nível mais valioso é o de dados coletados por teleoperação no robô real que será utilizado; em seguida vêm robôs teleoperados coletando dados mais gerais, como no caso do GELLO; e, por fim, dados “egocêntricos”, coletados por humanos realizando tarefas do dia a dia — para os quais a XDOF pretende desenvolver sensores vestíveis próprios.

“A escolha da câmera afeta a qualidade dos dados — o que impacta diretamente o desempenho do algoritmo de rastreamento de mãos”, explicou Wu. “Se você não projetar bem o hardware desde o início, pode coletar dados com problemas que não previu.”

A empresa pretende contratar e treinar grandes equipes globais de operadores — tanto de teleoperação quanto de coleta egocêntrica — um modelo intensivo em mão de obra que levanta uma questão óbvia: por que os grandes laboratórios não fazem isso por conta própria?

“Você precisa de armazéns gigantes, com centenas de robôs”, disse Wu. “É preciso manter esses robôs, calibrar seus parâmetros físicos e treinar operadores adequadamente.”

Essa infraestrutura exige foco, capital e escala operacional que muitos laboratórios de IA preferem terceirizar — exatamente o mercado em que a XDOF está apostando.

O nome XDOF faz referência ao termo de robótica “graus de liberdade”, que descreve o número de movimentos independentes que um robô pode realizar. Um braço humano, do ombro ao pulso, tem sete graus de liberdade; já o robô mais recente da empresa Figure.AI tem 30. O “X” no nome da empresa representa sua ambição: “graus de liberdade arbitrários, ilimitados”, como diz Wu.

Fonte: TechCrunch