AMD EPYC e a guerra silenciosa das CPUs: por que a razão CPU‑GPU importa mais do que nunca

A corrida por GPUs dominou os holofotes desde o boom do ChatGPT, mas a AMD EPYC está no centro de uma virada silenciosa que está redesenhando a arquitetura dos data centers modernos: a CPU voltou a ser um componente crítico, não apenas um componente de suporte. A causa é a IA agêntica, e o impacto já aparece nos balanços financeiros e no projeto físico dos racks.

De 8 GPUs por CPU para uma equação radicalmente diferente

CPU AMD Epyc 9654 se torna o mais rápido no ranking do PassMark

No início da era generativa, a lógica de provisionamento era simples e brutal: empilhar GPUs. As conversas com chatbots exigiam entre quatro e oito GPUs para cada CPU no stack, porque o peso computacional era quase inteiramente de inferência paralela, terreno em que as placas gráficas dominam com folga. A CPU ficava à margem, gerenciando o sistema operacional e agendando workloads, mas raramente como gargalo.

Esse modelo está sendo revisado. À medida que a IA migra de chatbots reativos para sistemas agênticos, a demanda sobre o processador central muda de natureza. “Sistemas always-on de raciocínio em múltiplas etapas não criam picos breves de orquestração em torno das cargas de GPU”, disse Jason Beckett, diretor de tecnologia para Europa, Oriente Médio e África da Hitachi Vantara. “Eles exigem CPUs com alto número de núcleos operando em cargas sustentadas, continuamente. O requisito de infraestrutura sempre foi estrutural. Agora é apenas inevitável.”

O problema de latência é o gatilho imediato. Uma análise recente da TrendForce aponta que as CPUs são responsáveis por quase 91% de toda a latência nas respostas de sistemas de IA, um número que expõe o ponto fraco da arquitetura atual. Em um pipeline agêntico, onde chamadas de ferramentas, coordenação de tarefas e tomadas de decisão em cadeia precisam ser rápidas e previsíveis, esse peso sobre o processador central não pode ser ignorado.

A AMD viu o sinal antes do mercado reagir

A AMD tinha uma projeção de crescimento do mercado de CPUs da ordem de 18% ao ano. A empresa revisou esse número para cima: a taxa de crescimento dobrou para 35% anuais, e a companhia projeta que o segmento se torne um mercado de US$ 120 bilhões até o fim da década. O crescimento é puxado em grande parte por hyperscalers, que estão aumentando a proporção de CPUs por nó para lidar com orquestração, gerenciamento de memória, coordenação de redes e armazenamento em clusters de IA em escala.

“O que os resultados da AMD e da Arm estão nos dizendo é que isso é um requisito estrutural, não cíclico”, avaliou Roger Cummings, CEO da PEAK:AIO. “Na prática, dois deslocamentos estruturais estão impulsionando a demanda: a ascensão da IA agêntica e a necessidade de performance determinística e previsível em escala de rack.”

Os processadores EPYC da AMD figuram diretamente nessa equação. O segmento de CPUs para data center da empresa registrou crescimento robusto, impulsionado pela demanda de hyperscalers que valorizam o alto número de núcleos e a bandwidth de memória dos EPYC para tarefas de orquestração em clusters de IA. Não é um detalhe financeiro: é um indicativo de reposicionamento do produto no ecossistema.

O rack de IA que a mídia não mostra

AMD's AI Future is Rack Scale 'Helios' - by Ryan Smith

“Na mídia, um rack de IA é retratado como uma caixa gigante de GPUs”, disse Hommer Zhao, fundador da OurPCB, fabricante de PCBs com mais de 15 anos de experiência. “Mas do ponto de vista do hardware, uma GPU é apenas um motor muito rápido e muito burro. Ela não consegue se comunicar com a internet nem puxar dados de um HD.”

Na prática, as configurações estão mudando. Em vez de uma única CPU hospedeira mal pareada com múltiplas GPUs, hyperscalers estão implantando nós com CPUs de alto número de núcleos, mais canais de memória e, em alguns casos, múltiplas CPUs por nó para acompanhar a demanda de movimentação de dados. O design térmico também mudou: em ambientes com refrigeração líquida, as CPUs passaram a integrar o mesmo envelope de dissipação que as GPUs, deixando de ser resfriadas separadamente com ar como se fossem um afterthought.

“À medida que os clusters de GPU escalam, as CPUs assumem papéis maiores em orquestração, gerenciamento de memória, rede, coordenação de armazenamento e inferência”, afirmou Jeff Moore, vice-presidente de parcerias estratégicas da Aegis Cooling, especializada em soluções de refrigeração líquida de próxima geração para IA e infraestrutura de alto desempenho.

Arm no centro, hyperscalers com silício próprio

Enquanto a AMD avança com o EPYC no segmento de CPUs para data center, a Arm colhe os frutos de apostas feitas anos atrás pelos próprios hyperscalers. Segundo Beckett, a Arm responde por “quase metade de todo o compute embarcado nos principais hyperscalers em 2025, com mais de um bilhão de núcleos Neoverse implantados.” O Graviton da AWS, o Axion do Google e o Cobalt da Microsoft são a materialização concreta dessa tendência: CPUs com arquitetura personalizada, otimizadas para alto throughput, eficiência energética e integração estreita com redes e armazenamento.

Esses são projetos de longo prazo, não reações ao hype do momento. “O holofote não revelou algo novo”, resumiu Beckett. “Ele está apenas iluminando finalmente o que as equipes de infraestrutura sérias nunca pararam de construir.”

O que a razão CPU-GPU muda para o mercado

Em 2026, a disputa por CPUs para data center já não é mais um tema secundário da cobertura de IA: é o próximo front da guerra de infraestrutura. A AMD ocupa uma posição privilegiada nesse cenário com o EPYC, mas o movimento dos hyperscalers em direção ao silício próprio com arquitetura Arm levanta uma questão que o mercado ainda não respondeu: até onde vai o espaço para CPUs de prateleira em um ecossistema que está caminhando para hardware cada vez mais especializado? Para o entusiasta que acompanha o setor, o dado mais revelador não é o crescimento de 35% nem o mercado de US$ 120 bilhões. É o fato de que a infraestrutura de IA finalmente está sendo projetada pelo gargalo que sempre existiu, não pelo componente que mais brilhava na vitrine.

Fonte: Tom’s Hardware

Você também pode gostar dos artigos abaixo:

Carregar ROMs no Sega Genesis via vinil: o experimento maluco que quase funcionou

Relatório da ONU: IA pode dobrar consumo de energia até 2030

Leia mais

Variedades
Pesquisa revela que os Paleo-Inuítes navegavam pelos mares do Ártico há 4.500 anos
Sorocaba
Procurado pela Justiça é identificado pela GCM durante atendimento no Plantão Policial
Tecnologia
Pentágono coloca Alibaba, BYD, Baidu, Unitree e mais 180 empresas chinesas na lista de companhias militares, e proíbe contratos com o Departamento de Defesa
Variedades
Bacia do São Francisco: petroleira terá de recuperar poços abandonados
Política
BRB precisa de R$ 8,8 bilhões para fazer frente a perdas com o Master
Variedades
5 produções de crimes reais brasileiros no Prime Video que vão te prender no sofá

Mais lidas hoje