A IA que Resolve Problemas de Nível de Doutorado — e o que Isso Muda na Ciência

Tempo de leitura: 9 minutos | Nível: Para todos os públicos

Em julho de 2024, seis problemas foram entregues a 609 dos estudantes de matemática mais brilhantes do planeta — vindos de 108 países — numa competição chamada Olimpíada Internacional de Matemática, a IMO.

A IMO não é uma prova de cálculo. Não é uma competição de velocidade de operações numéricas. É uma competição de raciocínio puro — cada problema exige uma prova matemática rigorosa, um argumento lógico completo demonstrando que uma afirmação é verdadeira. Os seis problemas cobrem álgebra, teoria dos números, geometria e combinatória. São problemas que os melhores estudantes de matemática do mundo levam horas para resolver — ou não resolvem.

Naquele mesmo ano, uma equipe do Google DeepMind enviou um sistema de inteligência artificial chamado AlphaProof para tentar resolver os mesmos problemas.

O sistema obteve 28 pontos de 42 — resolvendo quatro dos seis problemas, incluindo o mais difícil de todos, que apenas cinco dos 609 competidores humanos conseguiram resolver.

28 pontos. O limiar para medalha de ouro era 29.

A IA ficou a um ponto da medalha de ouro na competição de matemática mais prestigiosa do mundo.

E um ano depois, em julho de 2025, uma versão mais avançada — Gemini Deep Think — voltou à IMO. Desta vez, atingiu o padrão de medalha de ouro.

Por que matemática é diferente — e por que isso importa

Para entender por que esses resultados são tão significativos, é preciso primeiro entender por que a matemática de competição foi, por décadas, considerada o teste definitivo para a inteligência artificial.

Computadores são extraordinariamente bons com números. Calculam mais rápido que qualquer humano. Guardam mais informação. Nunca erram uma multiplicação. Por isso, o senso comum dizia que máquinas deveriam ser boas em matemática.

Mas matemática de nível olímpico não é sobre calcular. É sobre raciocinar.

Um problema de IMO típico pede algo como: “Prove que para quaisquer inteiros positivos a e b, o número (a²+b²)/(ab+1) é sempre um quadrado perfeito sempre que for um inteiro.” Não há uma fórmula para aplicar. Não há um procedimento a seguir. É preciso construir um argumento lógico original — descobrir uma cadeia de raciocínio que ninguém necessariamente percorreu antes.

Modelos de linguagem como o ChatGPT conseguem imitar matemática superficialmente — repetem padrões que viram no treinamento, geram respostas que parecem corretas. Mas quando confrontados com problemas genuinamente novos que exigem raciocínio original, frequentemente falham de formas que revelam a ausência de compreensão real.

O AlphaProof resolveu esse problema de uma forma radicalmente diferente.

Como o AlphaProof funciona — e por que é diferente

O AlphaProof combina dois elementos que, juntos, criam algo qualitativamente novo.

O primeiro elemento é um grande modelo de linguagem — o Gemini da Google — que traduz problemas matemáticos escritos em linguagem natural para Lean, uma linguagem de programação formal usada por matemáticos para escrever provas que podem ser verificadas mecanicamente. Em Lean, cada passo de uma prova precisa ser logicamente justificado — você não pode “pular” etapas ou usar intuição não fundamentada.

O segundo elemento é um algoritmo de aprendizado por reforço — o mesmo princípio que permitiu ao AlphaGo da DeepMind dominar o jogo de Go. O sistema tenta provar proposições matemáticas em Lean, recebe feedback imediato sobre se cada passo é logicamente válido ou não, e aprende quais estratégias de prova funcionam melhor.

Para treinamento, a equipe coletou cerca de um milhão de problemas matemáticos de diversas fontes e usou o Gemini para traduzi-los para Lean — criando um banco de aproximadamente 80 milhões de proposições formais para o sistema praticar.

O resultado é um sistema que não imita matemáticos — ele raciocina matematicamente. Cada prova que produz é verificável passo a passo. Não há “achismo” nem padrões superficiais. Cada linha da prova é ou logicamente válida ou não é, e o sistema sabe a diferença.

O AlphaProof resolveu dois problemas de álgebra e um de teoria dos números na IMO 2024, determinando a resposta e provando que estava correta — incluindo o problema mais difícil da competição, resolvido por apenas cinco dos 609 competidores humanos.

O ano em que a IA virou colaboradora de pesquisa real

A medalha de ouro na IMO foi extraordinária. Mas o que aconteceu depois foi ainda mais perturbador — e mais significativo para o futuro da ciência.

Em novembro de 2025, o Google DeepMind anunciou que o Gemini Deep Think havia sido usado por matemáticos de pesquisa reais para resolver problemas abertos — não problemas de competição com resposta conhecida, mas questões que ninguém havia conseguido responder ainda.

O Gemini Deep Think colaborou com o matemático Terence Tao — ganhador da Medalha Fields, o Nobel da matemática — e com Javier Gómez-Serrano, da Universidade de Brown, para atacar problemas abertos em matemática.

Terence Tao é amplamente considerado o matemático mais talentoso da sua geração. Quando Tao diz que um sistema de IA foi útil para fazer matemática de pesquisa real, a declaração tem um peso diferente.

A colaboração mostrou que o AlphaEvolve pode ajudar a descobrir novos resultados em uma série de problemas — não apenas redescobrir soluções conhecidas, mas encontrar insights genuinamente novos em questões abertas.

E foi além. O sistema Gemini Deep Think autonomamente resolveu e contribuiu para a generalização de resultados reportados em um paper de pesquisa, além de contribuir com proposições intermediárias em dois outros papers acadêmicos — trabalhos submetidos a periódicos respeitados e classificados como de “qualidade publicável”.

Deixa isso assentar: uma inteligência artificial contribuiu com descobertas originais em matemática de pesquisa, publicadas em periódicos científicos revisados por pares, com seu nome figurando como colaboradora.

Não é só matemática — é a ciência toda

A matemática é a linguagem da física, da biologia computacional, da química quântica e da ciência de materiais. Uma IA capaz de raciocinar matematicamente em nível de pesquisa não é apenas uma curiosidade para olimpíadas — é uma ferramenta potencialmente transformadora para toda a ciência.

Considere o problema da dobra de proteínas. Em 2020, o AlphaFold2 da DeepMind resolveu um dos maiores problemas em aberto da biologia — prever a estrutura tridimensional de proteínas a partir de sua sequência de aminoácidos. Um problema que havia ocupado biólogos estruturais por 50 anos foi resolvido por uma IA com uma precisão que deixou a comunidade científica atônita.

O impacto foi imediato e concreto. Em 2023, o AlphaFold havia sido usado por mais de dois milhões de pesquisadores em mais de 190 países. As estruturas que ele previu aceleraram a descoberta de novos antibióticos, antivirais e tratamentos para doenças raras. Em 2024, os criadores do AlphaFold receberam o Prêmio Nobel de Química — compartilhado com os pesquisadores de proteínas David Baker da Universidade de Washington.

É o primeiro Nobel dado explicitamente por uma descoberta habilitada por inteligência artificial.

E agora o mesmo laboratório que criou o AlphaFold está criando sistemas capazes de raciocinar matematicamente em nível de pesquisa. A trajetória aponta em uma direção clara.

O que muda para a ciência — e o que não muda

Aqui é onde a honestidade científica exige cuidado.

O AlphaProof e o Gemini Deep Think são avanços genuinamente extraordinários. Mas é importante separar o que eles fazem do que a ficção científica sugere que a IA fará.

O que eles fazem bem:

Resolver problemas bem definidos com critérios claros de verificação — como provas matemáticas em Lean, onde cada passo é ou válido ou não
Explorar espaços de soluções enormes muito mais rapidamente do que humanos conseguiriam
Identificar padrões em grandes conjuntos de dados matemáticos que seriam invisíveis para uma mente humana sozinha
Automatizar as partes mais tediosas e mecânicas da pesquisa, liberando pesquisadores para as partes mais criativas

O que eles ainda não fazem:

Formular as perguntas certas — identificar quais problemas valem a pena resolver
Ter intuição sobre quais abordagens têm mais chance de funcionar sem tentar exaustivamente
Compreender o significado dos resultados no contexto mais amplo da ciência
Trabalhar de forma verdadeiramente autônoma em problemas abertos sem direção humana

Kevin Buzzard, matemático do Imperial College London, foi claro: embora os problemas da IMO sejam difíceis, o assunto ainda é conceitualmente simples comparado à matemática de pesquisa avançada, e há muitos desafios a superar antes que a IA consiga resolver problemas no nível da matemática de pesquisa de forma autônoma.

A IA está se tornando um colaborador extraordinariamente poderoso. Não um substituto.

A questão que isso levanta para a ciência

Há uma pergunta que os filósofos da ciência estão começando a fazer com urgência crescente: quando uma IA contribui para uma descoberta científica, quem entendeu?

Quando o AlphaFold previu a estrutura de uma proteína, ele não “entendeu” a biologia da proteína da forma que um biólogo entende. Ele encontrou a resposta certa por um processo matemático que o levou lá. A resposta é certa — verificada experimentalmente. Mas o caminho para chegar lá não é o mesmo caminho que um humano percorreria.

Quando o Gemini Deep Think contribui com uma proposição intermediária num paper de matemática, essa proposição é matematicamente válida — verificada em Lean. Mas o sistema tem alguma intuição sobre por que ela é verdadeira? Ou simplesmente encontrou que ela era verdadeira por busca exaustiva?

A distinção pode parecer filosófica. Mas tem consequências práticas.

A ciência não é apenas um catálogo de resultados corretos. É uma compreensão de como o mundo funciona — uma rede de conceitos interligados, de modelos que explicam não apenas o quê mas o porquê. Se passarmos a confiar em sistemas que chegam às respostas certas sem uma explicação compreensível do caminho, corremos o risco de acumular conhecimento sem compreensão.

Essa tensão não tem resolução fácil. E a velocidade com que a IA está avançando significa que a ciência e a filosofia terão que correr para acompanhar.

A aceleração que não para

Em 2016, o AlphaGo derrotou o campeão mundial de Go — um feito que especialistas diziam ser impossível por décadas. Em 2020, o AlphaFold resolveu o problema das proteínas. Em 2024, o AlphaProof ficou a um ponto da medalha de ouro na IMO. Em 2025, o Gemini Deep Think atingiu o ouro e começou a colaborar em pesquisa matemática real.

“Imagino que não vai demorar muito para que computadores obtenham pontuação máxima na IMO”, disse Buzzard.

A trajetória é consistente. Cada ano, os sistemas fazem algo que o ano anterior parecia impossível. E a IMO, que por décadas foi o teste definitivo do raciocínio matemático humano, está rapidamente se tornando um benchmark que a IA supera rotineiramente.

O que vem depois da IMO? A fronteira da matemática de pesquisa não resolvida — as grandes conjecturas abertas, os problemas do Milênio, as questões que ocuparam as mentes mais brilhantes da humanidade por décadas sem resolução.

O Problema de Riemann, que descreve a distribuição dos números primos e tem implicações para a criptografia moderna, está aberto desde 1859. A Conjectura de Goldbach, que afirma que todo número par maior que 2 é a soma de dois primos, está aberta desde 1742. Há sete Problemas do Milênio, cada um com prêmio de um milhão de dólares pela solução — apenas um foi resolvido desde que foram propostos em 2000.

Ninguém sabe se a IA vai resolver algum desses. Mas pela primeira vez na história, essa é uma pergunta que a ciência pode fazer com seriedade.

O que isso significa para você

Pode parecer que a IA resolvendo problemas de IMO é assunto de matemáticos e engenheiros de software. Não é.

Os algoritmos que emergem dessas pesquisas — sobre como fazer máquinas raciocinar em vez de apenas calcular — são os mesmos que vão acelerar a descoberta de novos medicamentos, novos materiais para baterias e células solares, novas formas de entender o clima, novas terapias para doenças que hoje não têm tratamento.

O AlphaFold já salvou anos de trabalho experimental para milhares de laboratórios. Os próximos sistemas — capazes de raciocinar matematicamente sobre física, química e biologia — podem fazer o mesmo em escalas que ainda não conseguimos imaginar.

A ciência sempre avançou sobre os ombros de gigantes. Pela primeira vez, alguns desses ombros podem ser de silício.