Novo modelo tenta diferentes estratégias para resolver problemas e identifica seus próprios erros. Apenas usuários pagantes terão acesso à ferramenta.

A OpenAI lançou, nesta quinta-feira (dia 12/09), o modelo de inteligência artificial o1, prometendo que ele será melhor em resolver problemas envolvendo matemática, conhecimentos científicos e linguagens de programação.

O o1 é o modelo conhecido anteriormente pelo codinome interno “Strawberry”. Havia uma grande expectativa para o lançamento desta IA.

Segundo a OpenAI, o o1 foi treinado para pensar por mais tempo nas questões apresentadas antes de respondê-las, “como uma pessoa faria”, nas palavras usadas no comunicado. Por isso, ele deve ser capaz de tentar diferentes estratégias e reconhecer erros.

o1 supera GPT-4o em matemática e ciências

Um resultado disso é que o o1 se saiu muito melhor que o GPT-4o em um teste qualificatório para a Olimpíada Internacional de Matemática. Enquanto o GPT-4o conseguiu resolver corretamente apenas 13% dos problemas, o o1 acertou 83%.

Vale lembrar que, há cerca de um mês, o Google DeepMind afirmou que os modelos AlphaProof e AlphaGeometry 2 combinados resolveram quatro dos seis problemas da prova final da Olimpíada Internacional de Matemática de 2024, o suficiente para conseguir uma medalha de prata.

Voltando ao o1, a OpenAI diz que o novo modelo tem desempenho similar ao de estudantes de doutorado em tarefas envolvendo física, química e biologia.

Mesmo assim, a empresa reconhece que não foi possível resolver completamente o problema das alucinações — termo do jargão da IA para quando uma ferramenta cria uma resposta bem escrita e articulada, mas que, na verdade, é falsa ou incorreta.

Novo modelo ainda tem limitações

Apesar de superar o GPT-4o nestas tarefas envolvendo raciocínio lógico, o o1 ainda fica devendo muitos recursos encontrados no ChatGPT e em ferramentas do tipo.

O novo modelo só aceita entradas em texto, sem processar imagens ou documentos. Ele também não é capaz de buscar informações em tempo real na internet, nem se sai tão bem na hora de responder sobre fatos conhecidos.

Outra diferença é que o o1 é mais lento que o GPT-4o. Ele pode levar até 30 segundos para devolver uma resposta. Depois, o modelo apresenta os passos que o levaram até a solução.

Apenas para assinantes

A OpenAI vai disponibilizar duas versões do novo modelo: o1-preview e o1-mini, este segundo dedicado a geração de códigos de programação.

Usuários dos planos Plus e Team poderão, a partir desta quinta (12), acessar os dois novos modelos por meio do ChatGPT. Para assinantes Enterprise e Edu, as novas ferramentas chegam na semana que vem.

O o1-preview terá limite de 30 mensagens semanais; com o o1-mini, este número é um pouco maior, com 50 mensagens. A OpenAI diz que planeja oferecer o o1-mini para usuários gratuitos do ChatGPT.


Por Giovanni Santa Rosa