Novo modelo da OpenAI chega em três variantes com 33% menos alucinações que o GPT-5.2, capacidade nativa de controlar computadores e janela de contexto de 1 milhão de tokens na API
OpenAI lançou o GPT-5.4, descrito pela empresa como seu modelo de fronteira mais capaz e eficiente para trabalho profissional. O modelo está disponível em três variantes: standard, Thinking e Pro, cada uma otimizada para diferentes tipos de uso.
O GPT-5.4 apresenta melhorias significativas em precisão, com 33% menos afirmações falsas e 18% menos erros em respostas completas em comparação ao GPT-5.2. Além disso, o modelo introduz capacidade nativa de uso de computador, podendo interpretar telas e controlar mouse e teclado para automatizar fluxos de trabalho.
A janela de contexto via API alcança 1 milhão de tokens, a maior já oferecida pela OpenAI. O modelo também registrou recordes em benchmarks como OSWorld-Verified (75%) e GDPval (83%).
Precisão aprimorada com 33% menos alucinações
Segundo a OpenAI, o GPT-5.4 reduz em 33% a probabilidade de erros em afirmações individuais em comparação ao GPT-5.2. As respostas completas também apresentam 18% menos erros no total, o que representa ganho relevante para aplicações profissionais.
O modelo obteve 83% no benchmark GDPval, que avalia tarefas de conhecimento profissional. No benchmark MMMU-Pro, que testa compreensão multimodal, o score atingiu 81,2%. Esses resultados posicionam o GPT-5.4 como o modelo mais preciso da OpenAI até o momento.
Capacidade nativa de uso de computador
O GPT-5.4 introduz funcionalidade de Computer Use, permitindo que o modelo interprete screenshots e execute comandos de mouse e teclado para completar tarefas em aplicações. A capacidade opera por meio da biblioteca Playwright, utilizada em automação de navegadores.
Os desenvolvedores podem configurar o comportamento do modelo via mensagens de sistema para tarefas em ambientes web e desktop. O recurso obteve 75% no benchmark OSWorld-Verified e recordes no WebArena Verified, testes que avaliam a capacidade de agentes de IA em operar computadores.
Três variantes para diferentes necessidades
O GPT-5.4 Thinking está disponível para usuários do ChatGPT nos planos Plus, Team e Pro. Essa variante prioriza planejamento antecipado e oferece controle durante o processo de raciocínio, permitindo que o usuário direcione o modelo enquanto ele processa a resposta.
O GPT-5.4 Pro, otimizado para alto desempenho em tarefas complexas, está restrito aos planos Pro e Enterprise. No benchmark BrowseComp, a variante Pro alcançou 89,3%, contra 82,7% da versão standard. Usuários Enterprise e Education recebem acesso antecipado ao modelo.
Janela de contexto de 1 milhão de tokens na API
A versão API do GPT-5.4 oferece janela de contexto de até 1 milhão de tokens, a maior já disponibilizada pela OpenAI. Requisições que ultrapassem 272 mil tokens são cobradas em tarifa dobrada, segundo a documentação oficial.
O preço da API para a versão standard é de US$ 2,50 por milhão de tokens de entrada e US$ 15 por milhão de tokens de saída. A versão Pro custa US$ 30 por milhão de tokens de entrada e US$ 180 por milhão na saída. O recurso Tool Search reduz o consumo de tokens em até 47%.
Benchmarks e desempenho técnico
O GPT-5.4 registrou avanços em múltiplos benchmarks reconhecidos pela indústria. No SWE-Bench Pro, que avalia resolução de problemas de engenharia de software, o modelo atingiu 57,7%. O OmniDocBench apresentou taxa de erro de 0,109.
A eficiência de tokens também melhorou em relação ao GPT-5.2. Segundo a OpenAI, o GPT-5.4 resolve os mesmos problemas com significativamente menos tokens que seu antecessor, reduzindo custos operacionais para desenvolvedores que utilizam a API em produção.
GPT-5.2 será descontinuado em junho de 2026
O GPT-5.2 Thinking permanecerá disponível por três meses para usuários pagos na seção Legacy Models do seletor de modelos. A data prevista para descontinuação é 5 de junho de 2026.
A transição para o GPT-5.4 representa a atualização mais abrangente da OpenAI para aplicações de inteligência artificial generativa em contexto profissional. O modelo combina ganhos de precisão, capacidades agênticas e eficiência de custos em uma única atualização.