No anúncio feito na quinta-feira (7), a OpenAI afirmou que o GPT-5 é melhor em programação e no raciocínio para resolver problemas complexos, e o apresentou como avançado o suficiente para transformar o ChatGPT em um especialista de nível de doutorado. Alguns usuários com acesso antecipado elogiaram o modelo, com ressalvas. “É meu novo modelo favorito”, escreveu o desenvolvedor Simon Willison em um blog, chamando-o de “competente” e “ocasionalmente impressionante”. Ele acrescentou: “Não é uma mudança dramática em relação ao que já tínhamos antes”.
Em várias redes sociais, no entanto, usuários do ChatGPT expressaram frustração com o fato de o GPT-5 continuar inventando informações e errando questões simples de matemática e ortografia. Noah Giansiracusa, professor associado de matemática na Bentley University, disse que considerou o lançamento “decepcionante”. Embora tenha notado “algumas melhorias”, afirmou que “elas foram muito mais marginais do que eu esperava”.
Pelo menos parte dessa reação pode estar ligada à confusão sobre o que acontece nos bastidores. Ao contrário dos softwares anteriores da OpenAI, o GPT-5 alterna automaticamente entre modelos com diferentes níveis de sofisticação, dependendo da consulta. Essa abordagem pode ajudar a maximizar os recursos computacionais da empresa, mas também significa que os usuários nem sempre interagem com a versão mais potente da tecnologia.
Ao ser questionado sobre quantas vezes a letra “b” aparece em “blueberry”, por exemplo, o GPT-5 respondeu inicialmente “três” em um teste. Quando foi instruído a “pensar melhor”, porém, o GPT-5 pareceu acionar seu modelo de raciocínio mais avançado e chegou à resposta correta.
Na sexta-feira (8), Altman respondeu a alguns dos comentários e disse que havia um problema no sistema. “O GPT-5 vai parecer mais inteligente a partir de hoje”, afirmou. “Ontem, o mecanismo de troca automática apresentou falhas por boa parte do dia, e o resultado foi que o GPT-5 pareceu muito mais burro.”
O lançamento tem peso estratégico. A OpenAI busca manter a dianteira frente à crescente concorrência de rivais nos EUA e na China. A empresa também tenta convencer empresas e usuários individuais a pagar por seus serviços premium, para ajudar a compensar os enormes gastos com talentos, chips e data centers para sustentar o desenvolvimento de IA.
Com sede em São Francisco, a empresa deu início ao boom da IA generativa há quase três anos com o lançamento do ChatGPT, originalmente alimentado por um modelo anterior, o GPT-3.5. Desde então, lançou sistemas cada vez mais sofisticados, incluindo opções capazes de imitar o processo de raciocínio humano.
À medida que os sistemas de IA avançam, torna-se mais difícil dizer com clareza como os diferentes serviços se comparam. No meio do dia de sexta-feira, o GPT-5 liderava várias categorias no LMArena, um ranking popular de modelos de IA baseado na avaliação dos usuários. Mas, em outro teste de referência, o ARC-AGI-2, o GPT-5 ficou atrás da versão mais recente do Grok, da xAI de Elon Musk.
Na ausência de avaliações mais definitivas, a disputa entre modelos às vezes se resume à “sensação” que transmitem. E com quase 700 milhões de pessoas usando o ChatGPT semanalmente, é inevitável haver discordâncias sobre a percepção do modelo. Além disso, leva mais de um dia para avaliar o impacto de um novo sistema de IA na vida pessoal e profissional de alguém.
Ethan Mollick, professor da Wharton School da Universidade da Pensilvânia que frequentemente testa modelos de IA, ficou impressionado com a capacidade do GPT-5 de fazer pesquisas, criar respostas criativas e simplificar a programação, mesmo para iniciantes.
“O GPT-5 simplesmente faz coisas, muitas vezes extraordinárias, às vezes estranhas, às vezes bem típicas de IA, por conta própria”, escreveu em um blog. “E é isso que o torna tão interessante.”
No Reddit, no entanto, as reações foram bem diferentes. Durante uma sessão de “Pergunte-me qualquer coisa” na sexta-feira, Altman recebeu críticas de usuários frustrados por não terem mais controle ou visibilidade sobre qual modelo responde às suas perguntas. Ele disse que a OpenAI tomaria medidas para responder a essas queixas, incluindo tornar o processo “mais transparente”.
Em certo momento, Altman respondeu a um usuário dizendo que a OpenAI considera a “qualidade da escrita” em uma versão do GPT-5 melhor do que no GPT-4.5. Em seguida, perguntou: “Você acha que está pior?”. Um usuário após o outro respondeu rapidamente: sim.