É o fim da web que conhecemos
A IA está mudando a forma como usamos a web ao mesmo tempo em que inunda o mundo com conteúdo questionável.
Publicado originalmente em 22 de fevereiro de 2024.
A web está em crise e a culpa é da inteligência artificial.
Durante décadas, buscar conhecimento on-line significava pesquisar e clicar nos links que o mecanismo de busca oferecia. As buscas dominaram tanto nosso comportamento na obtenção de informações que quase ninguém pensa em questioná-la.
Mas a IA está mudando tudo isso, e rápido. Uma nova geração de “mecanismos de resposta” alimentados por IA poderia facilitar a localização de informações, simplesmente nos dando as respostas para nossas perguntas, em vez de nos fazer percorrer páginas de links. Enquanto isso, a web vai se enchendo de conteúdo de qualidade duvidosa gerado por IA. Isso está poluindo os resultados de buscas e prejudicando a eficácia da pesquisa tradicional.
As consequências dessa mudança podem ser grandes. A procura de informações usando um mecanismo de busca talvez seja quase que completamente substituída por essa nova geração de sistemas de grande porte alimentados por modelos de linguagem, explica Ethan Mollick, professor associado da Escola Wharton da Universidade da Pensilvânia que ultimamente se notabilizou como analista dessas IAs.
Isso pode ser bom para os consumidores, mas também pode mudar completamente o delicado equilíbrio de sites, gigantes da tecnologia e anunciantes dos quais a internet que conhecemos depende há tempos.
Os agentes de IA ajudam a eliminar a desordem, mas pesquisas já sugerem que também acabam com qualquer necessidade de as pessoas entrarem nos sites em que confiam para obter respostas, diz Mollick. Sem tráfego, o modelo de negócios de muitos sites — o de fornecer informações úteis e geradas por humanos na web — poderia colapsar.
Ao longo da última semana, brinquei com um novo mecanismo de busca/navegador web gratuito e alimentado por IA no iPhone chamado Arc Search. Quando digito minha pesquisa, ele primeiro identifica a melhor meia dúzia de sites com informações sobre o tópico, depois usa a IA para “lê-los” e resumi-los.
É como ter um assistente que pode relacionar de forma instantânea e concisa os resultados de uma busca no Google para você. Isso poupa um tempo tão grande que aposto que, uma vez que as pessoas o experimentem, nunca vão pensar em voltar à antiga maneira de navegar na web.
Embora o Arc Search seja conveniente, eu me sinto um pouco culpado por usá-lo, porque em vez de clicar nos sites que ele resume, muitas vezes estou satisfeito com a resposta que me oferece. O criador do Arc está recebendo algo de graça — minha atenção —, e eu estou recebendo as informações que quero. Mas as pessoas que geraram essas informações não recebem nada. A empresa por trás da Arc não respondeu aos pedidos de comentários sobre o que seu navegador pode significar para o futuro da web. O executivo-chefe da empresa já disse no passado que acha que seu produto pode transformá-la, mas não sabe como.
Em dezembro, o jornal “The New York Times” processou a Microsoft e a OpenAI por suposta violação de direitos autorais relacionada a esse exato problema. O Times alega que as empresas de tecnologia exploraram seu conteúdo sem permissão para criar seus produtos de inteligência artificial. Em seu processo, o Times diz que essas ferramentas de IA desviam o tráfego que iria para as propriedades do jornal na web, privando a empresa de publicidade, licenciamento e receita de assinatura.
A OpenAI disse que está comprometida em trabalhar com criadores de conteúdo para garantir que estes se beneficiem da nova tecnologia e de novos modelos de receita. Muitos sites já estão em negociações com a OpenAI para licenciar seu conteúdo para uso em seus grandes modelos de linguagem. Entre eles está a Dow Jones, controladora doe “The Wall Street Journal”.
Quebra de código
A atividade no site de programação Stack Overflow diminuiu com a concorrência desses agentes de IA. A empresa divulgou em agosto que seu tráfego caiu 14% em abril, um mês após o lançamento do GPT-4 da OpenAI, que pode ser usado para escrever código que os programadores procurariam em sites como o Stack Overflow. Em outubro, a empresa anunciou que estava demitindo 28% de sua força de trabalho.
“O tráfego do Stack Overflow, assim como o de muitos outros sites, foi impactado pelo aumento do interesse nas ferramentas de IA generativa no último ano, especialmente no que diz respeito a perguntas simples”, diz Matt Trocchio, diretor de comunicações da empresa. Mas, acrescenta, esses grandes modelos de linguagem precisam obter seus dados de algum lugar — lugares como o Stack Overflow. E a empresa respondeu a essa nova onda de concorrência lançando seu próprio assistente de codificação alimentado por IA, o OverflowAI.
O tráfego de sites como o Reddit, que está cheio de perguntas e respostas de pessoas reais, pode ser o próximo, acredita Mollick. Um porta-voz do Reddit disse que a única coisa que um grande modelo de linguagem nunca pode substituir é a “genuína conexão com a comunidade e com humanos” do Reddit e que seu “modelo que coloca a comunidade em primeiro lugar transmite confiança, porque são pessoas reais compartilhando e conversando sobre paixões e experiências vividas”. O Reddit deve abrir seu capital em março.
Por enquanto, são os primeiros adeptos que entregam aparentemente todos os aspectos de sua vida a essas IAs. E, se a adoção pelos usuários for seguida por investimento, os bilhões que estão sendo despejados no ChatGPT da OpenAI, na startup de pesquisa de IA Perplexity, apoiada por Jeff Bezos, no novo Gemini AI do Google e no Copilot da Microsoft podem abrir caminho para o futuro que Mollick imagina. (Atenção futuros historiadores: 2024 foi a primeira vez que um anúncio de uma IA foi veiculado durante o Super Bowl — do Copilot da Microsoft.)
Liz Reid, gerente geral de pesquisa do Google, disse que a empresa não prevê que as pessoas de repente mudem para a pesquisa baseada em chat de IA de uma só vez. Ainda assim, fica claro que o Google está levando a ameaça desse tipo de busca muito a sério. A empresa entrou com tudo nessa frente, realocando pessoal e recursos para lidar com a ameaça e a oportunidade da IA, e agora, em um ritmo rápido, está lançando novos produtos alimentados por ela.
Esses produtos incluem a “experiência generativa de pesquisa” do Google, que combina um resumo criado por IA com resultados de pesquisa tradicionais. “Os usuários não estão apenas procurando resumos ou respostas de IA; eles realmente se preocupam com a riqueza e a diversidade que existe na web”, disse o CEO do Google, Sundar Pichai, em uma entrevista recente à CNBC. “Eles querem explorar também. Nossa abordagem realmente prioriza esse equilíbrio, e os dados que vemos mostram que as pessoas valorizam essa experiência.”
Hora de acabar com o Google?
Este momento também significa que há oportunidade para aqueles que desafiam. Pela primeira vez em anos, pequenas startups conseguem afirmar com credibilidade que podem desafiar o Google nas buscas, área em que a empresa tem mais de 90% de participação de mercado nos EUA.
Eric Olson é CEO da Consensus, startup de busca que usa grandes modelos de linguagem para oferecer resumos detalhados de artigos de pesquisa e insights sobre o consenso científico em vários tópicos. Ele acredita que empresas de pesquisa alimentadas por IA como a dele conseguem oferecer uma experiência superior à do Google em tópicos específicos, de forma a afetar, pouco a pouco, seu negócio de busca.
Quando questionada se as mídias sociais são ruins para a saúde mental dos adolescentes, a Consensus fornece um exemplo instrutivo: a Consensus usa IA para resumir os dez principais artigos sobre o assunto e, em seguida, oferece uma análise mais longa da diversidade de descobertas sobre o tema, em que cada artigo citado é resumido individualmente.
É um feito impressionante, que levaria muitas horas de esforço para um ser humano não especialista realizar por conta própria. (Posso poupar ainda mais seu tempo? Minha resposta é sim.)
Esse tipo de pesquisa alimentada por IA também é melhor do que simplesmente fazer a mesma pergunta a um grande modelo de linguagem como o ChatGPT, que é notoriamente relapso quando se trata de respondê-las, muitas vezes inventando estudos que não existem ou dando informações indevidas. Isso é conhecido como problema da “alucinação”, e forçar uma IA a utilizar apenas de um conjunto determinado de dados — como artigos científicos — pode ajudar a resolvê-lo, afirma Olson.
Isso não significa que a questão da alucinação possa ser erradicada completamente, afirma Mollick. Ela pode colocar o Google em desvantagem, porque se o maior mecanismo de busca do mundo errar uma em cada dez consultas à sua IA, existe um problema, mas se uma startup com uma oferta experimental tiver o mesmo desempenho, pode parecer um triunfo.
Crise de confiança?
Apesar dessas questões, os usuários podem migrar para mecanismos de resposta baseados em IA pela simples razão de que o conteúdo gerado dessa maneira ameaça tornar a web e as buscas cada vez menos utilizáveis. A IA já está sendo usada para escrever avaliações falsas, manipular vídeos de políticos e escrever artigos de notícias completamente inventados —tudo na esperança de atrair dólares, votos e visualizações de forma barata.
“O recente aumento de conteúdo gerado por IA, de baixa qualidade, representa desafios significativos para a qualidade de pesquisa do Google, com spammers aproveitando ferramentas generativas, como o ChatGPT, para produzir conteúdo que — em geral temporariamente — aparece bem classificado na busca do Google”, disse a especialista em otimização de mecanismos de busca Lily Ray.
O problema não está apenas nos resultados de pesquisas do Google. O conteúdo gerado por IA também foi visto no Google Maps, os resumos que aparecem acima e ao lado dos resultados de pesquisa, conhecidos como “trechos em destaque”, nas ofertas de compras do Google Shopping e nas notícias que a empresa apresenta em seus recursos de destaques, acrescenta ela.
É importante notar que o Google há décadas luta contra aqueles que manipulam seus algoritmos de pesquisa e atualiza continuamente seus sistemas para eliminar spam, independentemente da fonte. Suas diretrizes sobre conteúdo gerado por IA, atualizadas pela última vez em fevereiro, reafirmam que a empresa não vê problema em usá-la para ajudar a gerar conteúdo — mas apenas se isso atender aos consumidores.
Alguns links e listas errantes oferecidos pelo Google não são novidade em uma internet que sempre esteve cheia de desinformação gerada por humanos. Mas se agora o conteúdo falso pode ser produzido a uma taxa tal que se torne generalizado, isso pode gerar uma crise mais ampla de confiança em todos os resultados de busca oferecidos pelo Google e outros.
Não se sabe com certeza o que há do outro lado da atual transição pela qual a web está passando. Muita coisa depende da rapidez com que as pessoas mudam para a pesquisa alimentada por IA, do quão melhores são os modelos de linguagem futuros em comparação com os atuais e a IA de qual empresa seria dominante.
Haverá vencedores e perdedores nesse futuro, quando alguns sites e serviços se tornam obsoletos e outros se tornam fontes confiáveis e necessárias de informação — para as IAs.
traduzido do inglês por investnews