
OpenAI unveils its first custom chip, built by Broadcom
Na quarta-feira, a OpenAI revelou seu primeiro processador de inferência desenvolvido sob medida, projetado e fabricado em colaboração com a Broadcom. Batizado de Jalapeño, o novo processador foi projetado especificamente para atender às necessidades específicas dos sistemas de inferência da OpenAI. Os próprios modelos de IA da OpenAI auxiliaram no desenvolvimento do chip, informou a empresa.
Embora o chip ainda esteja em fase de testes, a OpenAI afirma que os primeiros resultados mostram um desempenho por watt significativamente melhor do que as alternativas de última geração disponíveis atualmente.
A parceria foi anunciada oficialmente em outubro, mas há muito tempo circulavam rumores sobre os planos da OpenAI de desenvolver um chip próprio como forma de reduzir a dependência da empresa das GPUs da Nvidia. Tanto o Google quanto a Amazon já desenvolveram chips personalizados com finalidade semelhante, frequentemente chamados de “aceleradores de IA” — circuitos integrados projetados especificamente para acelerar cargas de trabalho de aprendizado de máquina.
O presidente da OpenAI, Greg Brockman, explicou a abordagem da empresa ao desenvolvimento de chips em seu podcast interno, logo após o anúncio da parceria com a Broadcom.
“Temos um profundo entendimento da carga de trabalho”, disse Brockman no episódio. “Temos realmente buscado cargas de trabalho específicas que são mal atendidas, [e nos perguntado] como podemos criar algo que seja capaz de acelerar o que é possível?”
O Jalapeño foi projetado especificamente para inferência, o processo de executar modelos de IA pré-construídos em resposta a comandos do usuário. No anúncio, a OpenAI destacou o baixo custo operacional do chip ao executar modelos de codificação em tempo real. É provável que tarefas que exigem mais desempenho, como o pré-treinamento, ainda dependam do hardware da Nvidia, mas mesmo pequenas reduções nos custos de inferência podem contribuir muito para melhorar os resultados financeiros da empresa.
Otimizar esse sistema de inferência pode se revelar um fator crucial para a economia da IA daqui para frente — e é provável que isso ocorra em todos os níveis da pilha. A OpenAI já está desenvolvendo produtos autônomos, como o Codex e os modelos que os alimentam, bem como data centers para executar esses modelos. A adoção de chips desenvolvidos especificamente para essa finalidade permite que a empresa avance ainda mais nesse processo, conforme explicou em seu comunicado.
“A OpenAI não está apenas desenvolvendo modelos de ponta ou criando produtos com base neles; está projetando a infraestrutura subjacente a eles: arquitetura de chips, kernels, sistemas de memória, redes, agendamento, sistemas de implantação e experiência do produto”, escreveu a empresa. “Como a OpenAI atua em toda a pilha de tecnologia, cada camada pode ser otimizada com o mesmo objetivo: tornar seus modelos mais rápidos, mais confiáveis e mais acessíveis para os usuários.”