OpenAI responde ao Mythos 5 com GPT-5.5-Cyber mais poderoso

Após os  contratempos da Anthropic com o lançamento do Claude Fable 5, baseado no Mythos , a OpenAI está avançando com cautela com seu modelo de IA dedicado à cibersegurança. A empresa anunciou a disponibilidade completa do GPT-5.5-Cyber ​​para membros do programa Trusted Access for Cyber. O modelo foi apresentado em maio passado em uma versão beta com alguns recursos. A atualização oferece capacidades adicionais, como a realização de análises mais profundas em grandes bases de código, a identificação de componentes que representam um risco de segurança, a determinação da acessibilidade de código vulnerável, a validação de problemas potenciais em ambientes controlados, o desenvolvimento e teste de patches e a preparação dos elementos necessários para uma revisão humana do código. O aspecto de remediação é, portanto, reforçado.

Para corroborar suas afirmações, a OpenAI compartilhou alguns resultados de seu benchmark CyberGym, que avalia a capacidade de um agente reproduzir vulnerabilidades conhecidas em ambientes de software.

De acordo com a empresa, a versão final do GPT-5.5-Cyber ​​alcançou uma pontuação de 85,6% em avaliações de modelo único, em comparação com 81,8% para o GPT-5.5. “Esta é a maior pontuação do CyberGym que já registramos para um único modelo”, afirmou a empresa. O GPT-5.5-Cyber ​​também superou o GPT-5.5 em dois exigentes testes de segurança do mundo real: 39,5% contra 25,95% no ExploitGym, que avalia a capacidade dos agentes de transformar vulnerabilidades conhecidas em exploits funcionais que permitem a execução de código não autorizado. No SEC-bench Pro, especializado na descoberta de vulnerabilidades a longo prazo e na geração de provas de conceito (PoCs) em alvos de software complexos, o GPT-5.5-Cyber ​​alcançou 69,8%, em comparação com 63,1% do GPT-5.

Mais parceiros e proteção do software de código aberto.

O número de empresas de cibersegurança com acesso ao GPT-5.5-Cyber ​​está crescendo por meio do Programa de Parceiros Daybreak da OpenAI. Entre elas estão Cisco, Proofpoint, IBM, CrowdStrike, Palo Alto Networks, Wiz, Zscaler, Tenable, Sophos e outras. Governos também estão incluídos. O provedor especifica que estabeleceu parcerias com a França e a Alemanha, bem como com a União Europeia por meio da ENISA (Agência Europeia para a Cibersegurança).

A OpenAI também anunciou uma iniciativa, Patch the Planet, lançada em colaboração com a empresa de cibersegurança Trail of Bits e a plataforma de recompensas por bugs HackerOne. Seu objetivo é financiar pesquisadores especializados e fornecer a eles modelos dedicados para detectar e corrigir vulnerabilidades em softwares de código aberto. A empresa anunciou que mais de 30 projetos de código aberto se comprometeram a participar, incluindo cURL, Go, Python, Sigstore e pyca/cryptography.

Leia mais

Economia
Arrecadação federal bate recorde de R$ 266,8 bilhões em maio
Variedades
Gonet diz que não vê falta grave no caso da arma de Bolsonaro 
Variedades
Palavra do dia: “Indomável.” A força de quem continua de pé mesmo depois das maiores quedas
Sorocaba
Atletismo Paralímpico Sorocaba representará o município no Meeting Loterias Caixa em Goiânia (GO)
Tecnologia
Robô humanoide Codey quer educar crianças e cuidar de idosos, mas dá para confiar?
Sorocaba
Procon Sorocaba orienta mais de 2,8 mil consumidores a renegociar dívidas

Mais lidas hoje