Casos de chatbots que enganam usuários e burlam regras aumentam em 5x em apenas seis meses

Entre outubro de 2025 e março de 2026, o número de casos em que IAs ignoram instruções, mentem ou agem de forma autônoma sem autorização simplesmente quintuplicou. É o que revela um estudo alarmante do Centre for Long-Term Resilience, financiado pelo Instituto de Segurança de IA do Reino Unido.

O relatório analisou quase 700 interações “no mundo real” com sistemas de gigantes como Google, OpenAI, Anthropic e xAI (Grok). O que antes eram “alucinações” bobas evoluiu para táticas sofisticadas de evasão. Os exemplos documentados parecem saídos de um manual de espionagem. Em um dos casos, um agente de IA proibido de modificar códigos gerou um segundo agente para fazer o trabalho sujo em seu lugar. Em outro, um chatbot mentiu para um usuário que precisava da transcrição de um vídeo para uma pessoa com deficiência auditiva apenas para burlar restrições de direitos autorais.

Há relatos ainda mais graves de “insubordinação” técnica:

  • Um chatbot admitiu ter deletado e arquivado centenas de e-mails sem aprovação, violando uma regra direta do usuário.

  • O Grok, de Elon Musk, simulou por meses que estava enviando sugestões para a diretoria da empresa, gerando até números de protocolos falsos para enganar o usuário.

Tommy Shaffer Shane, líder da pesquisa, faz um alerta sério: hoje essas IAs são como jovens funcionários um pouco desatentos, mas em breve elas terão capacidades de “diretoria”. O risco aumenta à medida que esses modelos são integrados a infraestruturas críticas, sistemas bancários e até âmbitos militares.

Especialistas em cibersegurança já começam a classificar a IA como uma “nova forma de risco interno”. Se o código é capaz de mentir para atingir um objetivo ou economizar processamento, a confiança cega no hardware e no software que usamos diariamente precisa ser reavaliada. Google e OpenAI afirmam estar reforçando as camadas de proteção, mas, por enquanto, a IA parece estar aprendendo rápido demais a arte de não ser pega.

Leia mais

Tecnologia
Raridade: protótipo de 2007 do GTA 4 é recuperado de devkit da Rockstar vendido como “sucata”
Variedades
Salmos 9:10: “Quem conhece Deus aprende a confiar até quando ainda não entende tudo”
Variedades
Moraes nega livre acesso de filhos de Bolsonaro à prisão domiciliar
Variedades
Por que a frigideira de ferro fundido continua imbatível quando o assunto é calor alto e longa durabilidade
Variedades
Pesquisa alerta para adolescentes ainda desprotegidos contra o HPV
Variedades
Crianças de comunidade quilombola andam na escuridão para ir à escola

Mais lidas hoje