Como um dos principais arquitetos da Alexa da Amazon, Rohit Prasad está na vanguarda da inteligência artificial. Agora, encabeça a tentativa da empresa de recuperar o atraso na corrida da IA.
A Amazon se assustou com o aumento da capacidade de IA das concorrentes. Coube então a Prasad atualizar a tecnologia de sua assistente de voz Alexa e retomar as ambições de IA da gigante do e-commerce.
A Alexa — integrada em mais de 500 milhões de dispositivos em todo o mundo — é uma das assistentes de IA dominantes, junto com a Siri da Apple e o Assistente do Google. Mas a OpenAI lançou o ChatGPT e aí as regras da corrida da IA mudaram.
A Amazon colocou milhares de pessoas em uma nova equipe sob o comando de Prasad para desenvolver produtos de IA com vistas a atualizar a Alexa e outros negócios. A empresa vem construindo seus próprios grandes modelos de linguagem — o software por trás da IA generativa — e agora está treinando e ajustando a poderosa tecnologia.
Embora haja planos de lançar uma nova Alexa com IA já no mês que vem, fontes da Amazon dizem que a empresa tem lutado para alcançar OpenAI, Microsoft, Google e outros que já se dedicavam à nova IA. Os modelos de IA proprietários da Amazon ainda estão atrás dos de seus maiores concorrentes, dizem conhecedores e analistas do setor.
Se a empresa não conseguir recuperar sua vantagem em IA, corre o risco de perder sua posição de pioneira na inovação tecnológica.
“Neste momento, eles não são líderes”, disse Gil Luria, analista do banco de investimento D.A. Davidson.
A Amazon garante que não ficou para trás, e que está no jogo. Independentemente de qual software de IA seja bem-sucedido, a Amazon espera aumento de demanda nos seus negócios em nuvem devido à crescente necessidade de poder computacional. O CEO Andy Jassy disse esperar que a IA gere dezenas de bilhões de dólares em receita para a empresa nos próximos anos.
A Amazon não quis disponibilizar Prasad para uma entrevista. Um porta-voz da empresa disse que espera que ele conduza o desenvolvimento de modelos de IA da mesma forma que liderou os avanços na tecnologia de reconhecimento de fala.
Prasad, de 48 anos, há muito proclama que a IA interativa é um desenvolvimento desafiador, embora o sonho desse tipo de IA seja visto em livros, filmes e séries de ficção científica há décadas.
“Essa necessidade de se comunicar com uma máquina existe por um motivo na ficção”, disse Prasad em um vídeo da Amazon em 2022.
Quando criança, Prasad se interessou pelo potencial dos computadores falantes assistindo a “Jornada nas Estrelas”. Ele acabou se tornando um especialista em compreensão de linguagem natural em máquinas e construiu sua carreira em torno da tecnologia. Esse histórico se encaixou bem com as necessidades da Amazon, que, no início dos anos 2010, buscava criar um assistente virtual que pudesse entender e responder a comandos falados.
Em 2023, o papel de Prasad evoluiu de cientista-chefe da Alexa para líder da equipe de tecnologia mais promissora da Amazon. O grupo está tentando competir no mundo dos grandes modelos de linguagem e IA generativa, a tecnologia por trás do ChatGPT.
Este artigo é baseado em relatos de pessoas que trabalharam na IA da Amazon.
Deixando a Alexa mais inteligente
A Amazon trabalha com aprendizado de máquina e outras formas de IA há anos. Mesmo assim, a empresa está atrás das suas concorrentes na construção dos grandes modelos necessários para a IA generativa, que usa software treinado em grandes quantidades de dados para gerar soluções. A tecnologia consegue conversar e responder a instruções complicadas.
Poucas horas após o lançamento do ChatGPT no final de 2022, a equipe da Alexa de Prasad começou a testá-lo. Eles ficaram impressionados com a facilidade de uso e o conhecimento em vários tópicos. A equipe pediu ao ChatGPT para gerar código para recursos da Alexa, como controle de casa inteligente, e seus resultados às vezes foram melhores do que os dos sistemas internos da Amazon.
LEIA MAIS: Alexa está em milhões de casas — e a Amazon está perdendo bilhões
Prasad convocou uma reunião com funcionários para discutir o impacto que o ChatGPT pode ter na indústria de tecnologia. Em poucas semanas, elaboraram um plano para recuperar o atraso. A Amazon acelerou o trabalho em um grande modelo chamado Titan e iniciou um modelo mais novo chamado Olympus. O plano é usar seus modelos para refazer a Alexa e introduzi-los em outros negócios.
A empresa transferiu milhares de funcionários para a nova equipe sob o comando de Prasad, batizando-a de grupo AGI, visando mostrar sua ambição de desenvolver inteligência artificial geral, o próximo nível de IA que pode superar os humanos.
A Amazon demonstrou uma Alexa mais inteligente há um ano. A atualização — conhecida internamente como Remarkable Alexa — demorou mais do que o esperado para ficar pronta e ser lançada ao público. Atrasos no desenvolvimento de novos produtos não são incomuns em tecnologias de ponta.
Fazendo o básico e complexo
Pessoas com conhecimento dizem que o grupo de Prasad tem tido dificuldade com prazos acelerados e com a tentativa de fazer com que a IA criada pela empresa funcione corretamente. As metas mudaram com frequência, os prazos foram apressados e o grupo às vezes mostrou ter muita dificuldade para inovar com rapidez.
Antes do boom do ChatGPT, a Amazon vinha adicionando tarefas que a Alexa poderia realizar, fazendo com que a assistente funcionasse perfeitamente em vários produtos e tentando construir um negócio lucrativo. A Alexa foi instalada em carros, micro-ondas e até em óculos.
A experiência de Prasad com a assistente de voz era a compreensão e precisão da linguagem natural, fazendo-a responder perguntas comuns como “Como está o tempo hoje?” com poucas falhas. Antes do ChatGPT, pouco trabalho foi desenvolvido entre os grandes modelos de linguagem e a Alexa.
A Amazon vem tendo dificuldade para usar seus mais recentes modelos internos de IA para reformular a assistente. À medida que a empresa incluiu grandes modelos de linguagem na Alexa, a assistente de voz tornou-se menos confiável em tarefas simples. Em alguns testes, por exemplo, perdeu a capacidade de acender as luzes com mais de 90% de confiabilidade.
O porta-voz da Amazon não quis comentar sobre atrasos e soluções de problemas nos projetos de IA mais recentes.
Prasad disse em uma entrevista no ano passado que os recursos criativos e conversacionais da IA generativa podem impedi-la de executar tarefas básicas de forma confiável.
“Se você chegasse e dissesse: ‘Alexa, estou com calor aqui’ ou ‘Acho que está muito quente’, ela deveria perguntar: ‘Você quer diminuir o termostato ou baixar a temperatura?’. Não deveria falar para você ir à praia”, disse ele a um analista na entrevista postada no YouTube. “É por isso que a IA é um problema tão difícil, porque o contexto é crucial.”
Tecnologia interna
Tal como acontece com muitas empresas de tecnologia, a Amazon prefere desenvolver sua própria tecnologia para ter controle total sobre seus produtos e serviços. À medida que a corrida da IA progrediu, a empresa se apoiou cada vez mais em parcerias. Investiu US$ 4 bilhões na startup de IA Anthropic e recentemente contratou funcionários da Adept AI. Também ter parcerias com a Meta Platforms e outras.
Embora a Amazon tivesse planejado depender de seus próprios modelos para a Remarkable Alexa, decidiu integrar a tecnologia de IA da Anthropic e outras.
Com os planos de gastar mais de US$ 100 bilhões em data centers na próxima década para ajudar a atender à demanda de IA, a pressão interna para produzir seus próprios produtos nesse segmento vem crescendo. O CEO Jassy esteve mais envolvido com o grupo AGI do que o normal. Ele se reuniu com sua liderança a cada quatro ou seis semanas.
LEIA MAIS: O rival do ChatGPT: como usar o Claude AI, da Anthropic
A Amazon está planejando um evento para mostrar novas atualizações de dispositivos que podem destacar algumas novidades da Alexa. Há planos para uma assistente mais conversacional, que pode ajudar a redigir mensagens e dar conselhos sobre compras. A empresa considerou cobrar dos consumidores pela Alexa mais inteligente.
Os concorrentes também estão lançando chatbots e atualizando seus recursos já disponíveis.
A Apple revelou recentemente seu sistema Apple Intelligence com uma versão aprimorada de sua assistente Siri. Ele estará disponível nos novos modelos do iPhone 16 da empresa. O Google introduziu recentemente um novo assistente de IA generativa para seus celulares.
Escreva para Sebastian Herrera em sebastian.herrera@wsj.com