Um dos feitos impressionantes dos modelos foi a taxa de sucesso de 83% em um exame de qualificação para a Olimpíada Internacional de Matemática, em comparação com apenas 13% do GPT-4o, seu modelo anterior mais avançado. Além disso, no contexto de um concurso de matemática para estudantes do ensino médio americano, o o1 ficou classificado entre os 500 melhores participantes, mostrando sua capacidade de competir em um nível elevado.
A empresa explicou que o o1 foi treinado para pensar de forma semelhante a um ser humano diante de desafios difíceis, aprendendo a identificar e corrigir erros, desmembrar tarefas complexas em etapas mais simples e adotar abordagens alternativas quando necessário. Essa abordagem de raciocínio aprimorado tem aplicações diversas, como anotação de dados em pesquisas de saúde, geração de fórmulas complexas por físicos e criação de desenhos de múltiplas etapas por desenvolvedores de computadores.
Além do avanço em capacidade de raciocínio, os novos modelos também se destacam por suas medidas de segurança reforçadas. A OpenAI estabeleceu acordos com Institutos de Segurança de IA nos Estados Unidos e no Reino Unido para avaliação e aprimoramento contínuo dos modelos, tornando-os mais resistentes a tentativas de manipulação.
Esses avanços representam um marco significativo no desenvolvimento de inteligência artificial e abrem portas para aplicações cada vez mais complexas e sofisticadas em diversas áreas do conhecimento.