LineShine derruba El Capitan: supercomputador chinês é o primeiro a ultrapassar 2 ExaFLOPS FP64 só com CPUs

A China acaba de reescrever o topo da hierarquia do poder computacional global. O LineShine, supercomputador instalado no National Supercomputing Centre in Shenzhen (NSCS), desbancou o norte-americano El Capitan e assumiu a primeira posição da lista Top 500, tornando-se a primeira máquina da história a sustentar mais de 2 ExaFLOPS de desempenho em precisão dupla (FP64) usando exclusivamente CPUs. O feito não é apenas técnico: é um sinal geopolítico construído em silício doméstico.

2,198 ExaFLOPS só com CPUs: o que esse número realmente significa

No benchmark Linpack, o LineShine registrou 2,198 FP64 ExaFLOPS, marca que nenhum sistema havia alcançado antes sem recorrer a aceleradores dedicados, como GPUs ou XPUs. A máquina foi construída pelo Shenzhen Cloud Computing Center com processadores semi-custom LX2 de 304 núcleos baseados na arquitetura Armv9, operando a 1,55 GHz. No total, o sistema mobiliza 13,79 milhões de núcleos interligados por uma rede proprietária chamada LingQi, consumindo 42,2 MW de energia.

A organização interna do LX2 é cirúrgica: dois chiplets de computação por processador, 304 núcleos divididos em oito clusters de 38 núcleos cada. Cada núcleo carrega unidades Arm SVE (Scalable Vector Extension) e SME (Scalable Matrix Extension), que aceleram operações vetoriais e matriciais com suporte a FP64, FP32, BF16, FP16 e INT8. A arquitetura de memória é igualmente incomum: 32 GB de HBM on-package, entregando até 4 TB/s de largura de banda, combinados a até 256 GB de DDR5 externo, equilibrando throughput bruto e capacidade total.

Eficiência energética e a sombra do El Capitan

El Capitan retains No. 1 supercomputer ranking | Network World

Na métrica de desempenho por watt, o LineShine entrega 52,07 GFLOPS/W, número inferior aos 60,94 GFLOPS/W do El Capitan, que ainda detém vantagem nesse quesito graças aos seus aceleradores. Ainda assim, o desempenho por watt do supercomputador chinês deixa distante o Fugaku, japonês e também CPU-only, que oscila entre 14,78 e 16,84 GFLOPS/W. A comparação com o Fugaku é relevante porque reposiciona o LineShine como um salto de geração no paradigma de HPC sem aceleradores.

O sistema também alcançou o topo do ranking HPCG com 22,00 HPCG-PFLOPS. O ponto fraco aparece no HPL-MxP: apenas 7,92 EFLOPS em precisão mista, colocando o LineShine atrás do El Capitan, do Frontier e do Aurora nesse quesito. O motivo está no LX2 em si: o ganho ao passar de FP64 para precisão mista é de apenas 3,6x, bem abaixo do que sistemas com aceleradores integrados, como o AMD Instinct MI300A ou o Intel Ponte Vecchio, conseguem entregar. Limitações de largura de banda de memória para cargas mistas, maturidade de software e eficiência do interconect LingQi nesse contexto são fatores apontados como responsáveis pela diferença. A fonte ressalva, porém, que ainda é cedo para tirar conclusões definitivas sobre o desempenho do LX2 em cargas de precisão mista.

O detalhe que vai além dos benchmarks

A performance em FP64 seria notícia por si só, mas o aspecto mais revelador desse resultado está na decisão do NSCS de submeter os dados ao Top 500. Organizações que participam da lista expõem seus sistemas ao escrutínio técnico internacional, e essa escolha indica que o NSCS tem confiança de que o LineShine opera integralmente sobre tecnologia doméstica, fora do alcance de restrições de exportação impostas pelo governo norte-americano. O supercomputador não usa hardware que Washington possa cortar da cadeia de suprimentos chinesa.

Quando as restrições à exportação de chips avançados para a China se intensificaram, a aposta de Pequim em desenvolver uma cadeia de HPC independente parecia, para muitos analistas, ambiciosa demais para o curto prazo. O LineShine é a resposta empírica a esse ceticismo. O desafio agora não é técnico, mas estratégico: o sistema ainda não compete de frente com os líderes ocidentais em cargas de IA de larga escala, onde precisão mista e throughput de baixa precisão são decisivos. Para o ecossistema de HPC global, porém, a mensagem está clara: a corrida pelo exascale ganhou um novo protagonista que não depende de TSMC, NVIDIA ou Intel para seguir avançando.

Fonte: Tom’s Hardware

Você também pode gostar dos artigos abaixo:

A estratégia de Google e Amazon para disputar com a NVIDIA o mercado de chips de IA

 

Advogado é punido por usar comandos ocultos para influenciar IA em ação judicial

Leia mais

Sorocaba
Prefeitura de Sorocaba inicia implantação de quadra poliesportiva no Jardim São Guilherme
Variedades
Dia de prevenção de quedas traz alerta para idosos
Variedades
Em 1503, Vespúcio descobriu o “Caribe Brasileiro”: a vila fluminense onde aportou no início da colonização
Tecnologia
CrankGPT: o “ChatGPT” que só funciona se você girar uma manivela por 30 segundos
Política
Marinho pede solução do Supremo contra uso irregular do MEI
Sorocaba
Certificado é entregue a instituições de longa permanência para idosos de Sorocaba

Mais lidas hoje