Claude Mythos: IA da Anthropic Capaz de Realizar Ciberataques Completos Autonomamente

Notícias Portuguesas » Claude Mythos: IA da Anthropic Capaz de Realizar Ciberataques Completos Autonomamente
Preview Claude Mythos: IA da Anthropic Capaz de Realizar Ciberataques Completos Autonomamente

Avaliar o alcance de uma inteligência artificial em um ciberataque real é um desafio complexo. Ataques genuínos envolvem dezenas de ações sequenciais ao longo de horas ou dias, atravessando múltiplos sistemas e segmentos de rede, um cenário difícil de replicar em ambientes controlados de laboratório. Por essa razão, o Instituto de Segurança de IA do Reino Unido (AISI) dedicou-se a testar o Claude Mythos, o novo modelo da Anthropic projetado para detectar vulnerabilidades, e os resultados obtidos deixaram os pesquisadores apreensivos.

Conforme divulgado em uma publicação em seu site, os especialistas do AISI constataram que o Claude Mythos é apto a executar diversos tipos de ciberataques. Isso inclui simulações de ataques em rede de ponta a ponta, resolução de desafios de nível avançado para identificar vulnerabilidades e a orquestração autônoma de todas as etapas ofensivas. Embora a versão atual do Mythos ainda não alcance o patamar de um hacker experiente como Kevin Mitnick, uma futura atualização pode representar um perigo ainda maior.

Em desafios de Captura a Bandeira (CTF), onde modelos de IA devem identificar e explorar falhas em sistemas para recuperar informações ocultas, o Claude Mythos se posiciona no topo do ranking. O modelo da Anthropic supera o Claude Opus 4.6 e o GPT-5.4, tanto em níveis básicos quanto avançados. Nos desafios de nível expert, uma categoria que nenhuma IA conseguia completar há um ano, o modelo alcançou uma taxa de sucesso de 73%.

Claude Mythos Consegue Completar Ciberataques de Ponta a Ponta

A parte mais notável do relatório refere-se à simulação de ataques complexos. O AISI desenvolveu ‘The Last Ones’, uma simulação de ataque a uma rede corporativa estruturada em 32 passos consecutivos, que vão desde o reconhecimento inicial até a tomada de controle da infraestrutura. O Claude Mythos foi o primeiro a completá-lo integralmente em 3 de 10 tentativas, com uma média de 22 passos em todas as suas execuções.

De acordo com o AISI, a execução bem-sucedida desta prova exige a conexão de ações através de diversas fases, incluindo movimento lateral, extração de credenciais, exploração de aplicações web, escalada de privilégios e comprometimento da infraestrutura. Os pesquisadores estimam que um hacker experiente levaria aproximadamente 20 horas para concluir o cenário completo.

O modelo que mais se aproximou foi o Claude Opus 4.6, que ficou a poucos passos de assumir o controle total. Outras IAs como GPT-5.4, Codex ou Claude Sonnet 4.5 conseguiram apenas roubar credenciais, mas nunca escalaram privilégios.

O Modelo da Anthropic Possui Suas Limitações

Apesar dos dados indicarem que o Claude Mythos pode representar um perigo, o relatório também documenta as falhas do modelo. A IA não conseguiu completar o ‘Cooling Tower’, um ambiente de simulação focado em tecnologia operacional. Isso não significa que o modelo seja fraco nesse tipo de ataque, mas sim que ele encontra dificuldades antes de alcançar os componentes industriais.

A avaliação do AISI demonstra que o Claude Mythos já é capaz de executar um ataque corporativo completo de forma autônoma. É importante ressaltar que esses hacks são realizados em condições simuladas. Embora sejam realistas, eles excluem elementos de defesa como monitoramento ativo ou sistemas de resposta a incidentes.

Os pesquisadores concluíram que o Claude Mythos pode explorar sistemas empresariais de pequeno porte com pouca segurança. Nas mãos de um hacker, a IA poderia se tornar uma ameaça, levando o AISI a exortar as organizações a se protegerem contra futuros ataques.