
Databricks’ former AI chief thinks he can cut AI’s power bill by 1,000x
A busca pela próxima grande inovação em IA financiou alguns projetos bastante ambiciosos — mas uma empresa está aproveitando essa oportunidade para reconstruir a arquitetura computacional do zero.
Liderada por Naveen Rao, ex-chefe de IA da Databricks, a Unconventional AI promete tornar o processamento de inferência muito mais eficiente em termos de consumo de energia. A arma secreta: um novo tipo de arquitetura de computador baseada em osciladores.
Na quinta-feira, a empresa lançou seu primeiro modelo de IA — chamado Un-0 —, uma ferramenta de geração de imagens que mostra, pela primeira vez, como a tecnologia da empresa pode replicar sistemas convencionais de IA. Em um novo artigo que acompanha o lançamento, a equipe de pesquisa da empresa detalha como construiu um modelo de geração de imagens totalmente funcional usando uma simulação de software da nova arquitetura — que apresenta desempenho tão bom quanto os modelos de difusão de última geração.
“Este é o ‘hello world’ de um novo tipo de computador”, disse Rao ao TechCrunch. “Ao longo do próximo ano, vocês começarão a ver algumas notícias bem interessantes sobre isso.”
A saída do novo modelo Un-0 é semelhante à de modelos de geração de imagens como o Stable Diffusion ou o GPT Image 1 da OpenAI. O mais impressionante é como ele alcança esse desempenho. O modelo é construído sobre uma arquitetura baseada em osciladores, completamente diferente dos chips que alimentam a computação convencional e os LLMs tradicionais. As vantagens da computação baseada em osciladores são complexas, mas Rao acredita que, no fim das contas, ela reduzirá o consumo de energia em até 1.000 vezes.
Grande parte da infraestrutura necessária para chegar lá ainda está sendo construída. A versão atual do Un-0 roda em uma simulação de software dos chips osciladores da Unconventional, mas a empresa planeja divulgar em breve os esquemas de um chip real. A partir daí, o plano é construir uma pilha de inferência completa do zero, com a Unconventional AI, eventualmente, fornecendo capacidade computacional assim como qualquer outro provedor.
“Vamos construir um novo tipo de sistema composto por nossos chips”, diz Rao. “Vamos executar modelos de IA nesse sistema e teremos um cabo de rede por onde as solicitações entram e as inferências saem, mas tudo isso será feito com 1/1.000 da energia.”
É uma meta incrivelmente ambiciosa, especialmente para uma empresa que ainda conta com menos de 50 funcionários. Mas, dada a escala da expansão da IA e o custo previsto para atender à crescente demanda por inferência, essa pode ser uma das poucas iniciativas capazes de lidar com a magnitude do problema. Na visão de Rao, o fornecimento disponível de energia será um dos limites intransponíveis para a IA nos próximos anos — e o Unconventional é um dos poucos projetos capazes de lidar com isso.
“A expansão da IA é difícil por causa da energia. Esse será o limite fundamental nos próximos anos. Simplesmente não dá para ultrapassá-lo. No fim das contas, será um problema limitado pela energia”, afirma ele.