Publicidade

Nas primeiras horas de uma manhã de agosto, uma gerente de projetos de inteligência artificial do Google carregou a mais nova criação do laboratório DeepMind da empresa em uma plataforma que classifica modelos de IA.

O Google havia ficado para trás na corrida da IA, enquanto sua rival OpenAI atraía centenas de milhões de usuários para o chatbot ChatGPT. Pesquisadores do Google esperavam que um novo recurso — um gerador de imagens extremamente rápido — desse à gigante das buscas uma vantagem em um ponto fraco do ChatGPT.

Naina Raisinghani, conhecida internamente no Google por trabalhar até tarde da noite, precisava de um nome para a nova ferramenta para concluir o upload. Eram 2h30 da manhã, e não havia ninguém por perto. Então ela simplesmente inventou um, uma junção de dois apelidos que amigos lhe deram: Nano Banana.

Em poucos dias, o Nano Banana alcançou o primeiro lugar nos rankings de desempenho da plataforma LM Arena, virou tendência no X e superou em muito as expectativas de uso do Google. Em setembro, o aplicativo de IA Gemini, do Google, tornou-se o mais baixado da App Store da Apple.

Dois meses depois, o Google lançou seu modelo Gemini mais poderoso até então, que ultrapassou os concorrentes e se tornou o chatbot de IA mais capaz do mercado. Com isso, a empresa controlada pela Alphabet ultrapassou a OpenAI e assumiu a liderança no setor de IA.

As raízes profundas do Google em ciência e pesquisa, a disposição de investir bilhões de dólares no desenvolvimento de hardware próprio e mudanças na liderança nos últimos anos que abriram caminho para experimentações mais rápidas agora estão dando resultado. A empresa também conseguiu proteger — ao menos por enquanto — seu negócio vital de buscas da crescente popularidade dos chatbots, que estão mudando a forma como os consumidores usam a internet.

O trabalho do Google em IA começou a gerar receitas substanciais por meio de anúncios em buscas, versões pagas do Gemini para consumidores e empresas e a venda de novos chips de computador desenvolvidos internamente. O lançamento, em novembro, do mais recente modelo Gemini superou o ChatGPT em diversas métricas, fazendo as ações da Alphabet dispararem e acionando um “código vermelho” dentro da OpenAI. Desde então, a empresa reduziu a diferença com o lançamento de uma versão mais poderosa do ChatGPT, que ainda tem muito mais usuários do que o Gemini.

O CEO do Google, Sundar Pichai, destacou a magnitude da aposta em IA no dia do lançamento do novo modelo Gemini. “É ótimo ver que estamos lançando na escala do Google”, disse ele aos funcionários em um memorando interno.

Quando Pichai assumiu o comando do Google em 2015, a IA era uma tecnologia de grande interesse para pesquisadores de ciência da computação — e quase ninguém mais. No ano seguinte, ele declarou que a empresa conhecida pelos consumidores por seu buscador, mapas e ferramentas de produtividade apostaria tudo em IA.

Em um memorando publicado no blog da empresa, Pichai escreveu que a década anterior havia sido dominada por um mundo orientado aos smartphones. “Mas, nos próximos 10 anos”, previu, “vamos migrar para um mundo em que a IA vem em primeiro lugar, um mundo em que a computação se torna universalmente disponível”.

O Google já havia lançado as bases com uma divisão de pesquisa em IA chamada Google Brain, cofundada em 2011 por Jeff Dean, cientista da computação que ajudou a desenvolver a tecnologia de redes neurais que sustenta os atuais grandes modelos de linguagem. Alguns anos depois, o Google adquiriu a DeepMind, laboratório de pesquisa em IA sediado em Londres e cofundado por Demis Hassabis, um prodígio do xadrez que mais tarde dividiria um Prêmio Nobel por seu trabalho em um sistema de IA voltado à pesquisa biomolecular.

Em um movimento que chamou menos atenção na época, o Google também começou a projetar seus próprios chips de IA, acreditando que precisaria de muito mais poder computacional para sustentar aplicações como reconhecimento de voz. Esses chips, chamados de unidades de processamento tensorial (TPUs), foram projetados para consumir menos energia do que as unidades centrais de processamento (CPUs) ou as unidades de processamento gráfico (GPUs) usadas em placas de videogame. Eles se provariam um divisor de águas — para o Google e para o setor.

Publicidade

No início, porém, a empresa adotou uma abordagem cautelosa no desenvolvimento de seus próprios chatbots. Alguns executivos e pesquisadores tinham preocupações sobre a segurança dessa tecnologia, que pode produzir informações imprecisas, enviesadas ou problemáticas.

Julia Winn, ex-funcionária do Google Brain, disse que os chatbots inicialmente não eram vistos como centrais para as ambições mais amplas de IA da empresa e que, em testes com modelos iniciais, era fácil provocar respostas racistas ou sexistas.

“Esses riscos o Google levava muito mais a sério do que qualquer outro lugar onde trabalhei — e por razões compreensíveis”, afirmou. Essa cautela frustrou vários pesquisadores da empresa, alguns dos quais acabaram saindo.

Em agosto de 2022, o Google apresentou um modelo de chatbot com diversas capacidades de conversação, disponibilizando-o para um grupo limitado de pessoas por meio de um aplicativo chamado AI Test Kitchen, uma espécie de campo de testes. O Google o batizou de LaMDA e permitiu que os usuários testassem três funções: “Imagine It”, “List It” e “Talk About It (Dogs Edition)”, que permitia conversas apenas sobre cães.

O desafio do ChatGPT

Três meses depois, a OpenAI disponibilizou o ChatGPT ao público, após seu próprio esforço de vários anos para criar um chatbot capaz não apenas de dialogar, mas também de produzir histórias, piadas, código de computador e muito mais.

Em apenas cinco dias, um milhão de pessoas se inscreveram para testá-lo. Diferentemente do LaMDA, do Google, os usuários não enfrentavam grandes restrições sobre como poderiam usá-lo.

Alguns funcionários do Google que passaram anos trabalhando nessa tecnologia ficaram indignados ao ver a empresa ser ultrapassada. Outros ficaram surpresos com a rapidez com que o público adotou o ChatGPT.

Analistas e investidores passaram a questionar se o Google estava perdendo a próxima grande onda tecnológica. Perguntavam com que rapidez a empresa conseguiria lançar seus próprios produtos de IA e se a ascensão dos chatbots corroeria os negócios de busca e publicidade do Google, que haviam gerado US$ 254 bilhões em receita em 2022.

Dean e Hassabis, os dois veteranos cientistas de IA do Google, e James Manyika, um roboticista que entrou na empresa em 2022, trabalharam para unir as divisões DeepMind e Brain no treinamento de IA. Em janeiro de 2023, apresentaram ao conselho de administração da Alphabet um plano para construir o modelo mais inteligente da empresa até então.

Enquanto isso, o Google precisava oferecer rapidamente um chatbot aos usuários. No mês seguinte, lançou o Bard, baseado no modelo LaMDA — e errou na estreia.

Em um vídeo promocional, o Google mostrou o Bard respondendo a uma pergunta sobre o Telescópio Espacial James Webb. O chatbot afirmou incorretamente que o telescópio havia tirado “as primeiras imagens” de um planeta fora do sistema solar. O tropeço derrubou as ações da Alphabet em 8%.

Publicidade

Por volta dessa época, o cofundador do Google Sergey Brin, que havia se aposentado recentemente, estava em uma festa conversando com um pesquisador da OpenAI chamado Daniel Selsam, segundo pessoas familiarizadas com a conversa. Por que, perguntou Selsam, ele não estava trabalhando em tempo integral com IA? O lançamento do ChatGPT não havia despertado sua imaginação como cientista da computação?

Enquanto o ChatGPT se tornava um nome conhecido nos lares, o Google ainda patinava para tirar seu produto do papel. Brin decidiu que Selsam tinha razão e voltou ao trabalho.

Ao longo de 2023, executivos do Google se esforçaram para coordenar e alinhar seus esforços de desenvolvimento em IA. As culturas das divisões Brain e DeepMind eram diferentes — a primeira mais focada em pesquisa, a segunda em produtos —, o que criou tensões após a fusão, segundo ex-funcionários.

Ainda assim, o Google tinha uma vantagem esmagadora sobre sua grande rival: a OpenAI precisava captar recursos com investidores; o Google podia financiar pesquisa e desenvolvimento com seus lucros bilionários. Ao mesmo tempo, precisava evitar que a IA generativa matasse sua galinha dos ovos de ouro — sua participação de 90% no mercado global de buscas, base do negócio de publicidade.

Projeto Magi

Para definir como deveria ser uma busca impulsionada por IA, a empresa iniciou um esforço envolvendo várias equipes chamado Projeto Magi, liderado por Liz Reid, que se tornou vice-presidente de buscas do Google em 2024. O desafio, explicou ela em entrevista, era reformular o sistema de busca para apresentar rapidamente uma resposta clara quando a informação não estivesse contida em uma única página da web.

“As pessoas não apenas usam a busca, elas dependem da busca”, disse. “Se você errar, vai ouvir da sua mãe, do seu amigo, do seu filho.”

O Google lançou seu primeiro modelo Gemini antes do fim de 2023. Enquanto a OpenAI havia treinado inicialmente o ChatGPT principalmente com texto, o Google treinou o Gemini com texto, código, áudio, imagens e vídeo — um dos motivos pelos quais o desenvolvimento demorou mais, segundo ex-funcionários.

A primeira versão do Gemini ainda ficava atrás do ChatGPT em vários aspectos, mas a abordagem tecnicamente mais ambiciosa do Google renderia frutos ao longo do tempo, assim como sua pesquisa inicial em redes neurais.

“Acho que ainda nos beneficiamos dessa longa história”, observou Brin em dezembro, em um evento na Universidade de Stanford.

Grande parte do trabalho de Brin desde seu retorno envolveu destacar problemas do Gemini que precisavam ser corrigidos. Ele também ajudou a trazer de volta ao Google os pesquisadores Daniel De Freitas e Noam Shazeer em 2024, por meio da aquisição de US$ 2,7 bilhões da startup deles. Desde então, os dois ajudam a liderar os trabalhos no Gemini.

Em uma entrevista no palco da conferência Google I/O, em maio, Brin disse que continuava muito envolvido. “Costumo mergulhar bastante nos detalhes técnicos”, afirmou, “e esse é um luxo que eu gosto”.

Publicidade

“Quero usar isso”

Em maio de 2024, o Google apresentou os AI Overviews — resumos curtos gerados por IA que frequentemente aparecem no topo dos resultados de busca. A empresa constatou que os usuários passaram a fazer buscas mais complexas.

O que se seguiu foi a maior reformulação do buscador do Google em anos: o desenvolvimento do AI Mode, uma opção de busca que responde às consultas em uma conversa no estilo chatbot. Internamente, demonstração após demonstração mostrava o que era possível, mas também o quão difícil era reprogramar a busca para se tornar semelhante a um chatbot sem perder velocidade e qualidade, disse Reid.

Por fim, após muitas iterações, Reid afirmou que ela e outros membros da equipe começaram a enxergar valor suficiente para lançar o recurso ao público. “Começamos a nos pegar usando aquilo não apenas para testes, mas pensando: ‘Ah, eu quero usar isso’”, relembrou.

O Google lançou o AI Mode em maio. Também apresentou o Gemini 2.5, uma versão mais poderosa de seu modelo de IA, mas ele não gerou tanto burburinho quanto muitos funcionários esperavam. O preço das ações da Alphabet, que vinha caindo desde o início do ano, continuou fraco ao longo do verão.

A ameaça que a IA representava à dominância do Google em buscas acabou trazendo um efeito colateral positivo. Em agosto de 2024, um juiz federal decidiu que o Google mantinha um monopólio ilegal em buscas online e publicidade em buscas. A decisão afirmou que o acordo pelo qual o Google pagava US$ 20 bilhões por ano à Apple para ser o buscador padrão no navegador Safari do iPhone era anticoncorrencial.

Os advogados do Google argumentaram que o monopólio da empresa havia efetivamente terminado com o surgimento dos chatbots de IA como uma nova forma popular de busca. No ano passado, o juiz aceitou o argumento e decidiu que o acordo com a Apple poderia continuar com apenas pequenas alterações, ajudando o Google a evitar medidas mais severas.

Essa decisão, combinada com a introdução do Nano Banana em agosto, impulsionou as ações do Google.

Josh Woodward, que supervisiona o aplicativo Gemini e o Google Labs — uma espécie de campo de testes para novas aplicações de IA — chamou o lançamento do Nano Banana de um “desastre de sucesso”. Quando pessoas ao redor do mundo começaram a gerar milhões, e depois bilhões, de imagens, o Google teve dificuldade para encontrar capacidade computacional suficiente para atender à demanda. A empresa, segundo ele, recorreu a empréstimos emergenciais de tempo de servidor para ampliar a capacidade.

Em outubro, o Gemini tinha mais de 650 milhões de usuários mensais, ante 450 milhões em julho.

Publicidade

O lançamento do Gemini 3, em novembro, provocou outro gargalo de capacidade computacional. É um problema que o Google antecipa há mais de uma década, e sua solução — os chips de IA que desenvolveu — está se mostrando uma vantagem competitiva. Seu chip mais recente, chamado Ironwood, ajudou a reduzir significativamente o custo de operação dos modelos de IA.

A notícia, no fim de novembro, de que o Google estava em negociações para vender bilhões de dólares em chips para a Meta usar em seus próprios esforços de IA foi suficiente para derrubar as ações da Nvidia, maior fabricante de chips do mundo, em 7% naquele dia.

Em um memorando interno aos funcionários em dezembro, Pichai adotou um tom triunfante. “Estamos encerrando 2025 em uma posição excelente”, escreveu. “Ao olhar para onde estávamos como empresa apenas um ano atrás, é incrível ver o progresso.”

Escreva para Katherine Blunt em katherine.blunt@wsj.com

Traduzido do inglês por InvestNews