Nova versão da IA do DeepSeek promete conversas mais longas e mais memorização

Velocidade e popularidade dos modelos do DeepSeek desafiam a OpenAI

Por

A diretoria do DeepSeek anunciou a atualização de seu modelo de inteligência artificial V3 nesta terça-feira (19).

A V3.1 tem uma janela de contexto mais longa, de acordo com uma publicação do DeepSeek em seu grupo oficial do WeChat, o que significa que pode considerar uma quantidade maior de informações para qualquer consulta.

Isso poderia permitir manter conversas mais longas com melhor memorização, por exemplo.

A startup sediada em Hangzhou não ofereceu muitos detalhes sobre a atualização e não publicou a documentação nas principais plataformas, incluindo a Hugging Face.

Popularidade do DeepSeek

A velocidade e a popularidade dos modelos do DeepSeek desafiaram empresas americanas tradicionais, como a OpenAI, e demonstraram como as empresas chinesas podem avançar em inteligência artificial por aparentemente uma fração do custo.

Seu modelo R1, que superou vários rivais ocidentais em métricas padronizadas, surpreendeu o mundo quando foi revelado no início deste ano.

Os fãs do DeepSeek ainda aguardam o lançamento do R2, o sucessor do R1, com a mídia local culpando o perfeccionismo e as falhas do CEO Liang Wenfeng pelo atraso.

Exit mobile version