Openai tem lançado O3-Pro, um modelo de IA que a empresa afirma que ainda é o mais capaz.
O3-Pro é uma versão do Open O3 do OpenAI, um modelo de raciocínio que a startup lançou no início deste ano. Ao contrário dos modelos convencionais de IA, os modelos de raciocínio funcionam através de problemas passo a passo, permitindo que eles tenham um desempenho de maneira mais confiável em domínios como física, matemática e codificação.
O3-Pro está disponível para os usuários do ChatGpt Pro e da equipe a partir de terça-feira, substituindo o modelo O1-Pro. Os usuários da empresa e da EDU terão acesso na semana seguinte, diz o Openai. A O3-Pro também está ao vivo na API do desenvolvedor da Openai a partir desta tarde.
O O3-Pro custa US $ 20 por milhão de tokens de entrada e tokens de produção de US $ 80 por milhão na API. Os tokens de entrada são os tokens alimentados no modelo, enquanto os tokens de saída são tokens que o modelo gera com base nos tokens de entrada.
Um milhão de tokens de entrada é equivalente a cerca de 750.000 palavras, um pouco mais que “guerra e paz”.
“Em avaliações especializadas, os revisores preferem consistentemente O3-Pro o O3 em todas as categorias testadas e, especialmente, em domínios-chave como ciência, educação, programação, negócios e ajuda de escrita”, escreve o Openai em um Changelog. “Os revisores também classificaram o O3-Pro consistentemente mais alto para maior clareza, abrangência, seguidores de instruções e precisão.”
O O3-Pro tem acesso a ferramentas, de acordo com o OpenAI, permitindo pesquisar na Web, analisar arquivos, motivo sobre entradas visuais, usar o Python, personalizar suas respostas que alavancam a memória e muito mais. Como desvantagem, as respostas do modelo geralmente levam mais tempo que o O1-Pro para concluir, de acordo com o OpenAI.
O3-Pro tem outras limitações. As conversas temporárias com o modelo no ChatGPT estão desativadas por enquanto, enquanto o OpenAI resolve um “problema técnico”. O3-Pro não pode gerar imagens. E Canvas, o recurso de espaço de trabalho de IA do OpenAI, não é suportado pelo O3-Pro.
No lado positivo, o O3-Pro alcança pontuações impressionantes em benchmarks populares de IA, de acordo com os testes internos da OpenAI. No AIME 2024, que avalia as habilidades matemáticas de um modelo, o O3-Pro pontuar melhor do que o modelo de AI com melhor desempenho do Google, Gemini 2.5 Pro. A O3-Pro também supera o recentemente lançado Claude 4 Opus do Anthropic no GPQA Diamond, um teste de conhecimento científico em nível de doutorado.