Modelo de IA chinês de código aberto GLM-5.2 supera GPT-5.5 em benchmarks de programação

A Z.ai, startup chinesa de inteligência artificial antes conhecida como Zhipu, lançou o GLM-5.2, um modelo de linguagem de código aberto com 753 bilhões de parâmetros voltado para escrita de código e tarefas de longa execução.

Os resultados dos benchmarks colocam o modelo acima do GPT-5.5 em duas avaliações centrais: no SWE-bench Pro, o GLM-5.2 marcou 62,1 contra 58,6 do GPT-5.5; no FrontierSWE (Dominance), atingiu 74,4% contra 72,6% do modelo da OpenAI. No Terminal-Bench, o GLM-5.2 foi o primeiro modelo de código aberto a ultrapassar 80%, superando também o Gemini. No teste Humanity’s Last Exam com uso de ferramentas externas, o modelo da Z.ai obteve 54,7, acima dos 52,2 do GPT-5.5, ficando próximo do Claude Opus 4.8 (57,9).

A arquitetura usa uma otimização chamada IndexShare: um único indexador é reutilizado a cada quatro camadas de atenção esparsa, o que reduz os FLOPs por token em 2,9 vezes no contexto máximo de 1 milhão de tokens. O modelo também usa um esquema de previsão de múltiplos tokens (MTP) atualizado, que permite que a decodificação especulativa pule 20% mais tokens durante a inferência. A janela de contexto de 1 milhão de tokens é cinco vezes maior do que a do GLM-5.1, que tinha 200.000 tokens.

O GLM-5.2 opera em dois modos de raciocínio: o modo “máximo” gera em média 85.000 tokens por tarefa; o modo “alto” gera metade disso com melhor equilíbrio entre desempenho e consumo de recursos. Os arquivos do modelo estão disponíveis no Hugging Face sob licença MIT, o que permite download, ajuste e execução local sem custo de licença.

O acesso via API custa $1,40 por 1 milhão de tokens de entrada e $4,40 por 1 milhão de tokens de saída. Para desenvolvedores que preferem assinatura fixa, o plano Lite sai por $12,60 ao mês; o Pro, por $50,40 (cinco vezes mais recursos que o Lite); o Max, por $112,00 ao mês, com recursos vinte vezes maiores que o Lite e capacidade dedicada nos horários de pico. O modelo tem integração nativa com ferramentas como Claude Code, Cline e OpenClaw via endpoint compatível com Anthropic, trocando apenas a URL base e o nome do modelo.

Leia mais

Sorocaba
‘Médico na Praça’ ultrapassa 1,2 mil atendimentos em menos de dois meses
Variedades
Anvisa libera produtos da Ypê produzidos a partir de janeiro de 2026
Variedades
Companheiro de Alex Escobar revela o que causou entrada confusa ao vivo na Globo
Economia
Confiança dos técnicos impulsiona bons resultados do BNDES, diz Lula
Tecnologia
Mod transforma máquina de gelo em cooler e derruba temperaturas da GeForce RTX 3060 para 22°C
Sorocaba
Projeto Pérolas realiza sensibilização com equipe de Recém-Nascidos de risco da Policlínica

Mais lidas hoje