A V3.1 tem uma janela de contexto mais longa, de acordo com uma publicação do DeepSeek em seu grupo oficial do WeChat, o que significa que pode considerar uma quantidade maior de informações para qualquer consulta.
Isso poderia permitir manter conversas mais longas com melhor memorização, por exemplo.
A startup sediada em Hangzhou não ofereceu muitos detalhes sobre a atualização e não publicou a documentação nas principais plataformas, incluindo a Hugging Face.
Popularidade do DeepSeek
A velocidade e a popularidade dos modelos do DeepSeek desafiaram empresas americanas tradicionais, como a OpenAI, e demonstraram como as empresas chinesas podem avançar em inteligência artificial por aparentemente uma fração do custo.
Seu modelo R1, que superou vários rivais ocidentais em métricas padronizadas, surpreendeu o mundo quando foi revelado no início deste ano.
Os fãs do DeepSeek ainda aguardam o lançamento do R2, o sucessor do R1, com a mídia local culpando o perfeccionismo e as falhas do CEO Liang Wenfeng pelo atraso.