Pela primeira vez, modelos de inteligência artificial alcançaram notas mínimas para medalhas de ouro na Olimpíada Internacional de Matemática, embora participantes humanos tenham se saído melhor. O feito foi obtido por uma versão avançada do Gemini, do Google, e por uma ferramenta experimental da OpenAI, criadora do ChatGPT.
A IMO é a principal competição matemática para jovens até 20 anos, com seis questões valendo até 42 pontos no total. Na 66ª edição da IMO, realizada na Austrália, 67 dos 630 participantes ganharam medalha de ouro. O Gemini Deep Think e a IA experimental da OpenAI acertaram cinco questões, somando 35 pontos e garantindo ouro. Porém, cinco competidores alcançaram a pontuação máxima de 42, superando as IAs.
As empresas afirmam que seus modelos usaram raciocínio matemático via linguagem natural, e os resultados foram certificados pelos juízes da competição.
O que dizem as empresas
Em publicação, o Google afirmou que o modelo avançado do Gemini gerou demonstrações matemáticas rigorosas dentro do tempo e das regras da competição, iguais às dos participantes humanos. Um pesquisador sênior do Google DeepMind declarou em entrevista que o desempenho da ferramenta foi alcançado sem ajuda humana.
Resolvemos esses problemas completamente em linguagem natural. Isso significa que não houve intervenção humana — de nenhuma maneira.
No X, Alexander Wei, pesquisador da OpenAI, também comentou o feito e detalhou a importância da conquista.
Os problemas da IMO exigem um novo nível de pensamento criativo sustentado em comparação com os benchmarks anteriores. (...) Obtivemos um modelo que pode elaborar argumentos complexos e sólidos no nível de matemáticos humanos.
Google e OpenAI comemoraram os resultados, destacando que as medalhas de ouro representam avanços significativos no desenvolvimento de modelos de IA cada vez mais capazes de reproduzir o raciocínio humano e que, em breve, poderão contribuir para o progresso da matemática.