Casos de chatbots que enganam usuários e burlam regras aumentam em 5x em apenas seis meses

29/03/2026
14:39

Entre outubro de 2025 e março de 2026, o número de casos em que IAs ignoram instruções, mentem ou agem de forma autônoma sem autorização simplesmente quintuplicou. É o que revela um estudo alarmante do Centre for Long-Term Resilience, financiado pelo Instituto de Segurança de IA do Reino Unido.

O relatório analisou quase 700 interações “no mundo real” com sistemas de gigantes como Google, OpenAI, Anthropic e xAI (Grok). O que antes eram “alucinações” bobas evoluiu para táticas sofisticadas de evasão. Os exemplos documentados parecem saídos de um manual de espionagem. Em um dos casos, um agente de IA proibido de modificar códigos gerou um segundo agente para fazer o trabalho sujo em seu lugar. Em outro, um chatbot mentiu para um usuário que precisava da transcrição de um vídeo para uma pessoa com deficiência auditiva apenas para burlar restrições de direitos autorais.

Há relatos ainda mais graves de “insubordinação” técnica:

Um chatbot admitiu ter deletado e arquivado centenas de e-mails sem aprovação, violando uma regra direta do usuário.
O Grok, de Elon Musk, simulou por meses que estava enviando sugestões para a diretoria da empresa, gerando até números de protocolos falsos para enganar o usuário.

Tommy Shaffer Shane, líder da pesquisa, faz um alerta sério: hoje essas IAs são como jovens funcionários um pouco desatentos, mas em breve elas terão capacidades de “diretoria”. O risco aumenta à medida que esses modelos são integrados a infraestruturas críticas, sistemas bancários e até âmbitos militares.

Especialistas em cibersegurança já começam a classificar a IA como uma “nova forma de risco interno”. Se o código é capaz de mentir para atingir um objetivo ou economizar processamento, a confiança cega no hardware e no software que usamos diariamente precisa ser reavaliada. Google e OpenAI afirmam estar reforçando as camadas de proteção, mas, por enquanto, a IA parece estar aprendendo rápido demais a arte de não ser pega.

Fonte: hardware.com.br

Casos de chatbots que enganam usuários e burlam regras aumentam em 5x em apenas seis meses

Leia mais

Raridade: protótipo de 2007 do GTA 4 é recuperado de devkit da Rockstar vendido como “sucata”

Salmos 9:10: “Quem conhece Deus aprende a confiar até quando ainda não entende tudo”

Moraes nega livre acesso de filhos de Bolsonaro à prisão domiciliar

Por que a frigideira de ferro fundido continua imbatível quando o assunto é calor alto e longa durabilidade

Pesquisa alerta para adolescentes ainda desprotegidos contra o HPV

Crianças de comunidade quilombola andam na escuridão para ir à escola

Mais lidas hoje

BBB 26: Voto de minerva da Líder define Paredão polêmico; confira os emparedados

Prefeitura de Sorocaba entrega cerca de 100 colchões a moradores do Jardim Itapemirim e Jardim Marli

Festas simples que reuniam todo mundo e faziam a casa ficar cheia de alegria e movimento

Pets em serviço mostram inteligência ao salvar criança diabética

Visitantes conhecem características e curiosidades de animais que habitam o Zoo de Sorocaba

Salmos 34:4: “Quando busquei ao Senhor, o medo perdeu força dentro de mim”