O Google está fabricando mais de seus próprios semicondutores, preparando um novo chip que pode lidar com tudo, desde a publicidade no YouTube até a análise de grandes volumes de dados, tentando combater o aumento dos custos de desenvolvimento da inteligência artificial.
O novo chip, chamado Axion, é de um tipo comumente usado em grandes data centers. Ele se soma aos esforços do Google, que já duram mais de uma década, para desenvolver novos recursos de computação, começando com chips especializados usados na IA. A estratégia foi adotada desde o lançamento do ChatGPT no final de 2022, que deu início a uma corrida que ameaçou sua posição dominante como porta de entrada para a internet.
O desenvolvimento desse chip promete reduzir a dependência de fornecedores externos e incluir a empresa na concorrência direta com parceiros de longa data, como Intel e Nvidia, segundo analistas. Altos funcionários do Google disseram não ver isso como uma competição.
“Vejo como a base para aumentar o tamanho do bolo”, disse Amin Vahdat, vice-presidente do Google que supervisiona as operações internas de chips.
Os maiores concorrentes do Google na nuvem, a Amazon.com e a Microsoft, também investiram na fabricação de seus próprios chips, já que o boom da IA intensificou a demanda por recursos de computação.
O Google deve grande parte de seu sucesso inicial a um investimento nos chips necessários para alimentar seu algoritmo de busca. Isso muitas vezes significou unir hardware barato e comercialmente disponível de maneiras inéditas.
O boom da IA e sua necessidade de muito mais recursos de computação levaram o Google ainda mais na direção de soluções personalizadas. A empresa acredita que os chips de IA especializados que construiu, conhecidos como unidades de processamento de tensores, ou TPU na sigla em inglês, ajudam a economizar dinheiro em serviços que fazem uso pesado de IA.
O Google trabalha em estreita colaboração com a desenvolvedora de semicondutores Broadcom desde 2016 para produzir hardware sob medida.
A divisão de chips personalizados da Broadcom viu um crescimento nos negócios depois que o Google aumentou a produção de TPUs recentemente, afirmou seu executivo-chefe Hock Tan em uma apresentação interna em março. Segundo ele, o aumento se deveu em parte a uma resposta à Microsoft, que incorporou recursos de IA em seu mecanismo de busca Bing, competindo diretamente com o principal negócio do Google.
“Eles compraram uma tonelada”, disse Tan, de acordo com uma gravação à qual o Wall Street Journal teve acesso.
Para a Broadcom, o lucro operacional de mais de US$ 1 bilhão em um único trimestre recente veio principalmente dos negócios com o Google, afirmou Tan. A Broadcom não respondeu a um pedido de comentário.
A diretora financeira do Google, Ruth Porat, disse aos investidores em janeiro que gastos notavelmente maiores em infraestrutura técnica, como chips de IA, são esperados este ano. O investimento de capital de sua controladora, a Alphabet, no quarto trimestre aumentou quase 50%, chegando a US$ 11 bilhões, em relação ao ano anterior.
Conhecidos como unidades centrais de processamento, ou CPUs, os chips Axion são adequados para uma série de tarefas, incluindo alimentar o mecanismo de pesquisa do Google e o trabalho relacionado à IA. Eles podem desempenhar um importante papel de apoio no dedesenvolvimento da IA, ajudando a processar grandes quantidades de dados e lidando com a implantação dos serviços para bilhões de usuários, afirmaram funcionários do Google.
O Axion é baseado em circuitos da empresa britânica de design de chips Arm, fazendo do Google a terceira maior empresa de tecnologia, depois da Amazon e da Microsoft, a usar essa estrutura para uma CPU de data center. A mudança abalou o antigo status quo, no qual grandes operadoras de fazendas de servidores compravam suas CPUs quase que exclusivamente da Intel e da Advanced Micro Devices.
Esses fabricantes de chips também estão se adaptando ao cenário em mudança, oferecendo CPUs com recursos integrados para computação de IA e chips separados que se concentram exclusivamente em IA. A Intel lançou na terça-feira uma terceira geração de seus chips Gaudi AI que começarão a ser enviados aos clientes este ano.
O Google tem resistido a vender chips diretamente aos clientes, preferindo instalá-los em seus próprios data centers. A medida traria a empresa mais diretamente para a concorrência com a Intel e a Nvidia, a maior vencedora do boom de IA até agora, com mais de 80% do mercado de chips usados para desenvolver e atender a tecnologia.
“Tornar-se uma grande empresa de hardware é muito diferente de se tornar uma grande empresa de nuvem ou uma grande organizadora de informações do mundo”, disse Vadhat, do Google.
O Google optou então por alugar chips personalizados para clientes da nuvem. A empresa afirmou que os chips Axion estarão acessíveis a clientes externos ainda este ano, e que a última geração de seus TPUs já era amplamente disponível.
Em novembro, o Google declarou que conectou com sucesso mais de 50 mil TPUs para construir sistemas de IA, classificando o esforço como o maior desse tipo. Além disso, criou o Gemini usando TPUs e usará os chips exclusivamente para processar as buscas dos usuários.
O crescente negócio de nuvem da empresa exigiu equilibrar as demandas concorrentes das equipes internas e a demanda de startups de IA, como a Anthropic, uma situação dificultada pela restrições de insumos.
Algumas equipes dentro do Google foram informadas de que não receberão recursos de computação adicionais este ano, em parte por causa da crescente demanda por serviços de IA, segundo pessoas familiarizadas com o assunto.
Vahdat disse que o Google prioriza os produtos e serviços de crescimento mais rápido ao decidir quais áreas devem obter mais recursos de computação.
Seu desenvolvimento interno de chips começou em 2013 com um avanço na tecnologia de reconhecimento de voz.
Jeff Dean, líder de engenharia de longa data, disse à divisão de infraestrutura de sistemas que o Google precisaria praticamente dobrar o número de chips mantidos em seus data centers caso a tecnologia se torne amplamente usada. “Aquela foi realmente a primeira amostra dessa questão iminente.”
Quando o Google projetou a primeira versão do TPU alguns anos depois, Dean pressionou os executivos a comprar mais do que a empresa havia originalmente orçado. Mais tarde, os pesquisadores os usaram para criar um sistema de software chamado Transformers, que se tornou a base para produtos de IA generativos, como o ChatGPT.
O Google teve um sucesso misto com a abertura de acesso a clientes externos. Embora tenha contratado startups de destaque, incluindo a fabricante de chatbots Character e a empresa de geração de imagens Midjourney, alguns desenvolvedores tiveram dificuldade para criar software para os chips.
O Google disse que trabalhou com a Nvidia e outras empresas de tecnologia em um projeto de software, o OpenXLA, com o objetivo de facilitar o desenvolvimento de sistemas de IA com diferentes tipos de chips.
Em setembro, a Anthropic, uma das maiores usuárias de TPUs, começou a mover algumas necessidades de IA para chips personalizados desenvolvidos pela Amazon depois que a gigante da nuvem concordou em investir até US$ 4 bilhões. Mais tarde, o Google garantiu US$ 2 bilhões em financiamento para a Anthropic e disse que expandiu sua parceria com a startup.
A AssemblyAI, startup que trabalha em produtos de fala para texto, desenvolveu a versão mais recente de sua tecnologia em TPUs depois de ter problemas para proteger GPUs (unidades de processamento gráfico) no início do ano passado, afirmou o CEO Dylan Fox. “Do ponto de vista da disponibilidade, ficamos muito satisfeitos”, disse.
Os novos processadores Axion melhoram o desempenho em até 30% em comparação com os chips similares mais rápidos baseados em Arm disponíveis na nuvem, de acordo com dados internos do Google. A empresa disse que clientes, incluindo a Snap, planejam testar o novo hardware.
O investimento do Google na Axion já valeria a pena no caso de conseguir alcançar apenas metade das melhorias de desempenho estimadas, disse o analista principal da Forrester, Mike Gualtieri. Porém, ainda enfrenta intensa concorrência das outras grandes empresas de nuvem por novos negócios, completou ele.
“Será como qualquer outro conjunto de serviços web que esses hiperescaladores oferecem”, afirmou Gualtieri. “Vai ser uma espécie de toma-lá-dá-cá para todos os lados.”
Escreva para Miles Kruppa na [email protected] e Asa Fitch em [email protected]
Traduzido do inglês por InvestNews
Presented by