Pesquisadores descobrem brecha no ChatGPT que gerava imagens sexuais

Segundo a empresa de pesquisa e segurança em inteligência artificial Mindgard, o especialista Jim Nightingale utilizou um comando que circulava na plataforma de mídia social X, instruindo o ChatGPT a “restaurar imagens anexadas”, mesmo sem que nenhuma imagem tivesse sido fornecida.

Em vez de solicitar aos usuários que fornecessem arquivos, o sistema gerava imagens automaticamente. Os resultados iniciais eram principalmente imagens de mulheres sexualizadas. Quando os pesquisadores ajustaram alguns detalhes nos comandos, o ChatGPT continuou a produzir conteúdo sexualmente violento ou perturbador. O Sr. Nightingale faz parte da equipe de “contra-testes” da Mindgard. Esse método simula como os usuários poderiam explorar vulnerabilidades para fazer com que um sistema de IA viole as proteções estabelecidas.

A Mindgard observou que o fato de pequenas alterações no comando terem repetidamente contornado o filtro sugere que este pode não ser um incidente isolado. O caso representa um novo desafio para as empresas de IA na prevenção de conteúdo prejudicial sem restringir excessivamente o potencial criativo da tecnologia.

A OpenAI afirmou ter investigado o relatório e adicionado medidas de segurança para esse tipo de comando. A empresa identificou o problema como ocorrendo quando o comando se refere a uma imagem anexada, mas o usuário não carrega a imagem de fato. A OpenAI está ajustando o ChatGPT para que o sistema solicite aos usuários o arquivo ausente, em vez de gerar uma imagem aleatoriamente. A Mindgard também forneceu à empresa sessões e comandos relevantes para fins de teste.

Você também deve ler!

Combate mortal pelo consumidor: a guerra entre ChatGPT, Gemini e Claude que está movimentando o mundo

Leia mais

Tecnologia
Falha no iOS expõe sua identidade mesmo com VPN ativada
Variedades
Inmet prevê segunda sob frio intenso no Sudeste
Variedades
O que acontece no cérebro quando você vê as horas iguais no relógio e acha que é sinal?
Economia
Mercado eleva projeção de inflação e vê Selic em 14% ao ano em 2026
Sorocaba
“HumanizAção Inverno” acolhe 12 pessoas em situação de rua no domingo (21)
Variedades
Candidato de direita La Espriella vence disputa acirrada na Colômbia

Mais lidas hoje