Tokens mais caros que salários: executivo da NVIDIA revela paradoxo financeiro da IA

A narrativa de que a inteligência artificial seria a solução definitiva para reduzir custos operacionais está enfrentando um teste de realidade em 2026. Enquanto milhares de demissões foram justificadas pela adoção da tecnologia, os custos crescentes de computação e a falta de ganhos mensuráveis de produtividade estão invertendo a lógica econômica do setor.

O paradoxo que saiu da boca da NVIDIA

Bryan Catanzaro, VP de Applied Deep Learning da NVIDIA, afirmou em entrevista à Axios que, dentro da sua equipe, “o custo do compute está muito além do custo dos funcionários”. Para contextualizar a magnitude disso, basta olhar as vagas abertas no próprio time de Deep Learning da empresa: uma posição de Senior Software Engineer tem faixa salarial entre US$192.000 e US$243.000 por ano, e mesmo assim, segundo Catanzaro, o gasto com tokens supera esses valores.  O CEO Jensen Huang havia sinalizado a mesma direção em março, ao dizer que ficaria “alarmado” se um engenheiro da NVIDIA com salário de US$500.000 anuais não estivesse gastando pelo menos $250.000 por ano em tokens de IA.

A ressalva necessária é que o time de Deep Learning da NVIDIA opera num nível de intensidade computacional que não reflete o trabalhador médio do setor. Ainda assim, o sinal que essa dinâmica emite para o mercado mais amplo é relevante, especialmente quando outros casos concretos começam a se acumular.

Orçamentos queimando em semanas

O CTO do Uber revelou ter esgotado o orçamento anual de IA da empresa em apenas algumas semanas. O CEO da GetSwan compartilhou que a companhia gastou mais de US$113.000 em IA com um time de apenas quatro pessoas em um único mês. A Anthropic, por sua vez, dobrou o custo esperado para desenvolvedores individuais: de $6 por dia ativo para $13, o que equivale a aproximadamente $200 por mês por desenvolvedor, um valor que apenas a assinatura de tier mais alto cobriria.

A Microsoft anunciou a migração do Copilot no GitHub de cobrança por requisição para cobrança por uso. Na prática, prompts mais longos e respostas mais extensas passam a custar mais. Isso transforma as alucinações do modelo, antes apenas um incômodo técnico, em um problema com impacto direto no orçamento operacional. O modelo Mythos, da Anthropic, ainda interno e muito aguardado, é descrito como várias vezes mais caro por milhão de tokens do que o Claude Opus 4.7 ou o Claude Capybara. A escalada de custo não está desacelerando.

A IA agêntica adiciona outra camada de pressão: ferramentas como o OpenClaw executam requisições contínuas ao modelo, gerando um consumo de tokens que muitas empresas simplesmente não antecipam ao fechar seus orçamentos.

Produtividade: o dado que ninguém quer ver

O argumento central pró-IA no ambiente corporativo sempre foi o ganho de produtividade. O problema é que os dados de 2026 estão corroendo essa tese. Um estudo divulgado em fevereiro apontou que mais de 80% das empresas que adotaram IA não reportaram nenhum benefício mensurável de produtividade, apesar dos bilhões investidos. Para piorar, uma pesquisa do Harvard Business Review indica que o uso de IA está aumentando as taxas de burnout entre trabalhadores, não reduzindo. A ferramenta que deveria tirar tarefas da fila dos funcionários está, na prática, empurrando para eles trabalhos que antes seriam terceirizados ou simplesmente descartados.

Com 50% dos trabalhadores americanos usando IA de alguma forma, segundo dados divulgados em meados de abril, o volume de tokens consumidos no agregado é enorme, e crescente. A OpenAI, consciente das pressões de margem, aposta numa estratégia de escala: projeta perder até 35 milhões de assinantes do plano de US$20 mensais, mas substituí-los por 109 milhões de novos clientes pagando US$8 por mês na assinatura ChatGPT Go, segundo o The Information. É uma aposta arriscada: mais usuários com margens menores, num cenário onde os custos de infraestrutura continuam subindo conforme os modelos crescem em complexidade e os requisitos de hardware para servi-los escalam junto.

Você também deve ler!

A Internet fechou as portas para a IA: como o bloqueio de dados está forçando as Big Techs a pagar muito dinheiro

“Rusbé?” 9 funkos do Michael Jackson para celebrar o legado do Rei do Pop na sua estante

Quando os custos de tokens superam os custos salariais sem entregar retorno equivalente em produtividade, a conta deixa de fechar. Investidores estão começando a cobrar retorno sobre o que foi aplicado em IA, e isso deve se traduzir em modelos mais caros, mais restritos ou menos acessíveis para empresas e desenvolvedores. A Business Insider aponta que limitações de capacidade nos data centers já podem levar algumas empresas de IA a restringir o acesso a modelos ou até a serviços inteiros.

Em 2026, o cenário que está se desenhando é o inverso do que foi prometido: em vez de humanos sendo continuamente substituídos por tokens, empresas pressionadas por orçamentos podem começar a redescobrir que um trabalhador eficiente tem uma relação custo-benefício que nenhum modelo consegue bater quando o throughput de requisições sai do controle. A ironia é que a bolha de demissões “por causa da IA” pode ser seguida, em breve, por uma rodada de recontratações silenciosas, justificadas pelos mesmos critérios econômicos que levaram às dispensas. Para o mercado de tecnologia, a lição mais cara de 2026 pode ser a mais antiga do mundo corporativo: nem sempre a ferramenta mais sofisticada é a mais rentável.

Leia mais

Tecnologia
Escassez de HBM deve se agravar em 2027, alertam Samsung e SK Hynix
Economia
Trabalho de cuidado: “Mulheres têm escala 7×0”, diz pesquisadora
Variedades
Nem café, nem cascas de ovo: fertilizante caseiro vira “ouro verde” para revitalizar as plantas
Sorocaba
Prefeitura lança o “Médico na Praça” com atendimento clínico itinerante
Variedades
Marinhas brasileira e francesa fazem exercício na costa do Rio
Economia
Petrobras reajusta querosene de aviação em 18% e mantém parcelamento

Mais lidas hoje