A OpenAI anunciou na quinta-feira (11) o lançamento do GPT-5.2, chamando o modelo de inteligência artificial de seu mais avançado para o trabalho profissional do conhecimento.

O lançamento ocorre cerca de uma semana depois que o presidente da empresa, Sam Altman, declarou um esforço de “código vermelho” para melhorar a qualidade do ChatGPT  e atrasar o desenvolvimento de algumas outras iniciativas, incluindo publicidade.

A empresa tem estado em alerta máximo devido à crescente ameaça do mais recente modelo de IA do Google, o Gemini, que superou o ChatGPT em certos benchmarks, incluindo conhecimento em nível de especialista, puzzles de lógica, problemas de matemática e reconhecimento de imagem.

O novo modelo da OpenAI foi descrito pela empresa como melhor em benchmarks de matemática, ciência e codificação.

O negócio da OpenAI voltado para clientes corporativos também tem estado sob pressão da Anthropic, que recentemente intensificou seus esforços para vender para empresas.

“Nós projetamos o 5.2 para desbloquear ainda mais valor econômico para as pessoas”, disse Fidji Simo, presidente de aplicações da OpenAI, em uma teleconferência com repórteres na quinta-feira. “Ele é melhor na criação de planilhas, construção de apresentações, escrita de código, percepção de imagens, compreensão de longos contextos, uso de ferramentas e, em seguida, na vinculação de projetos complexos de múltiplas etapas.”

A aplicação da IA a tais tarefas será crítica à medida que as empresas buscam obter valor da ia e gerar um retorno sobre esses investimentos.

Simo, ex-ceo da instacart, ingressou na OpenAI este ano e é encarregada de ajudar a criadora do ChatGPT  a se tornar um negócio global lucrativo.

Ainda não está claro se o mais recente modelo da OpenAI, focado em produtividade e trabalho, conquistará clientes ou a ajudará a competir contra rivais. Muitas empresas ainda estão no início do uso de ia e ainda não viram retornos generalizados da tecnologia.

O GPT-5.2 mostra melhorias em raciocínio, codificação e trabalho com uma variedade de entradas, de texto a áudio, vídeo, e mais todas áreas em que a OpenAI enfrentou desafios do google e da Anthropic, disse arun chandrasekaran, analista da empresa de pesquisa de mercado e consultoria de TI Gartner. A empresa também progrediu em capacidades de trabalho do conhecimento essenciais para tornar o ChatGPT  o assistente de ia de escolha para trabalhadores profissionais, ele acrescentou.

Crescente Competição

Ray Wang, fundador e principal analista da constellation research, disse que o GPT-5.2 é uma boa resposta ao Gemini do Google, mas não o suficiente para reverter o ímpeto de seu rival. Para as empresas, “o que a OpenAI fez foi facilitar a criação de ferramentas de produtividade de escritório”, disse Wang. “O Gemini ainda é mais integrado.”

A OpenAI não teve atualizações na quinta-feira sobre a geração de imagens no GPT-5.2. Essa capacidade tem sido um diferencial fundamental para o Gemini do Google desde o lançamento de seu gerador de imagens, nano banana, em agosto, e Altman listou a melhoria da tecnologia como uma prioridade chave em seu memorando de código vermelho para os funcionários.

No entanto, em comparação com a versão anterior de seu modelo, o GPT-5.1, lançado em meados de novembro, o GPT-5.2 “representa um salto enorme” em uma variedade de tarefas de trabalhadores profissionais, disse aaron levie, ceo e cofundador da box. As tarefas que os trabalhadores do conhecimento comumente assumem incluem a criação de planilhas e apresentações de slides.

No domínio do trabalho no mundo real, a OpenAI disse que o GPT-5.2 venceu ou empatou com os principais profissionais do setor em 70,9% das tarefas de trabalho do conhecimento no GDPVAL, sua própria métrica para medir o trabalho do conhecimento em 44 ocupações. Essas ocupações incluem empregos em setores como manufatura, serviços profissionais, saúde e finanças, onde as pessoas frequentemente trabalham com planilhas e apresentações.

O acesso ao GPT-5.2 começou a ser liberado para usuários pagantes do ChatGPT  na quinta-feira.

A primeira versão do GPT-5, lançada em agosto, foi turbulenta e mostrou a luta da OpenAI para permanecer a líder indiscutível em ia. Na época, os usuários inundaram as mídias sociais com exemplos embaraçosos de como o chatbot falhou ao responder a perguntas simples de matemática ou desenhar com precisão um mapa da américa do norte.

Simo, da OpenAI, disse na teleconferência de quinta-feira que o lançamento do GPT-5.2 havia sido planejado por muitos meses e não deveria ser considerado parte de seu esforço de código vermelho.

“Código vermelho, apenas para colocar as coisas em perspectiva, isso não é algo incomum”, disse ela. “Tivemos um aumento de recursos focados no ChatGPT  em geral. Eu diria que isso ajuda no lançamento deste modelo, mas não é a razão pela qual ele está sendo lançado nesta semana em particular.”

Também na quinta-feira, a disney disse que investiria US$ 1 bilhão na OpenAI e licenciaria seus personagens para uso no ChatGPT e Sora.

A news corp, proprietária do The Wall Street Journal, tem uma parceria de licenciamento de conteúdo com a OpenAI.

Escreva para Belle Lin em belle.lin@wsj.com.

Traduzido do inglês por InvestNews