DeepSeekMath-V2: IA Chinesa Alcança Nível Ouro na Olimpíada de Matemática

O DeepSeekMath-V2 alcançou o nível de medalha de ouro na Olimpíada Internacional de Matemática (IMO) de 2025.

O DeepSeekMath-V2, um novo modelo de inteligência artificial desenvolvido pela startup chinesa DeepSeek, alcançou um feito inédito ao atingir o nível de medalha de ouro na prestigiada Olimpíada Internacional de Matemática (IMO) de 2025. Este avanço coloca a empresa em pé de igualdade com gigantes ocidentais como OpenAI e Google DeepMind, demonstrando que a competição global no campo da IA está se intensificando rapidamente.

O modelo não apenas resolveu problemas complexos da IMO, mas também superou o melhor resultado humano na competição Putnam, sinalizando uma nova era para a capacidade de raciocínio matemático das máquinas. O feito do DeepSeekMath-V2 é notável por sua abordagem inovadora, que se concentra na capacidade de auto-verificação, permitindo que o sistema refine suas próprias soluções em tempo real [1].

O Que Torna o DeepSeekMath-V2 um Marco na IA Matemática?

Atingir o nível de medalha de ouro na IMO 2025, um concurso conhecido por exigir criatividade e raciocínio abstrato, é um marco que até recentemente era considerado inatingível para modelos de linguagem. O DeepSeekMath-V2 resolveu integralmente cinco dos seis problemas da IMO 2025 e quatro da CMO 2024 (Olimpíada Chinesa de Matemática). Na competição Putnam de 2024, o modelo obteve 118 de 120 pontos possíveis, superando a pontuação máxima humana de 90 pontos [1].

Este desempenho é resultado de uma arquitetura baseada no Deepseek-V3.2-Exp-Base, otimizada para o raciocínio matemático. A chave para o sucesso é o processo de refinamento iterativo, onde o modelo é incentivado a identificar e corrigir falhas em suas próprias provas antes de finalizar a solução. Essa transparência no método de trabalho contrasta com a abordagem mais reservada de laboratórios americanos, como OpenAI e Google, que também anunciaram modelos com desempenho similar, mas mantiveram os detalhes técnicos em segredo.

Como a Capacidade de Auto-Verificação Impulsiona o Modelo?

A principal inovação do DeepSeekMath-V2 reside na sua capacidade de auto-crítica. O modelo não apenas gera uma prova, mas também a submete a um processo de validação interna rigorosa. Isso simula a revisão por pares ou a auto-correção que um matemático humano faria, garantindo que o raciocínio por trás da resposta final seja sólido e lógico.

Este avanço tem implicações que vão além das competições acadêmicas. A capacidade de um modelo de IA de raciocinar de forma abstrata e verificar a própria lógica sugere que estamos nos aproximando de um ponto onde a IA pode resolver problemas complexos e abstratos que tradicionalmente exigiam habilidades humanas únicas. Isso pode ter um impacto significativo em áreas como pesquisa científica, engenharia e desenvolvimento de software.

Quando o DeepSeekMath-V2 Chegará ao Público e Qual o Seu Impacto no Brasil?

O lançamento do DeepSeekMath-V2 reforça a posição da China como um competidor de peso na corrida global pela inteligência artificial. A DeepSeek, ao publicar os detalhes técnicos de seu modelo, demonstra que as startups chinesas estão não apenas acompanhando, mas em alguns aspectos, liderando a inovação em IA.

A estratégia de lançar modelos de código aberto e de alto desempenho tem sido um diferencial para a DeepSeek, atraindo startups ocidentais que buscam alternativas mais econômicas aos modelos proprietários dos EUA. Essa rivalidade saudável impulsiona o desenvolvimento de modelos cada vez mais capazes, beneficiando a comunidade global de tecnologia.

O avanço da IA em tarefas de raciocínio complexo, como a matemática de nível olímpico, é um indicativo claro da velocidade da evolução tecnológica. Para o mercado brasileiro, isso significa a chegada iminente de ferramentas de IA mais robustas e confiáveis para análise de dados e resolução de problemas complexos.

Leia mais sobre o avanço da Inteligência Artificial:

O futuro do trabalho e a Inteligência Artificial

***

Referências

[1] DeepseekMath-V2 is Deepseek’s latest attempt to pop the US AI bubble – The Decoder. (https://the-decoder.com/deepseekmath-v2-is-deepseeks-latest-attempt-to-pop-the-us-ai-bubble/)

***