La compañía de inteligencia artificial Anthropic ha emitido una preocupante advertencia sobre su último desarrollo: Claude Mythos, un modelo de lenguaje especializado en ciberseguridad y la detección de vulnerabilidades.
Anthropic reconoce que tenía en sus manos una herramienta de gran potencial, tanto para el bien como para el mal, y por ello decidió restringir su acceso hace unas semanas. Sin embargo, sus esfuerzos de limitación no han sido suficientes, ya que recientemente la propia empresa ha comunicado que Claude Mythos ha caído en “manos equivocadas”, un hecho que genera considerable inquietud.
Hasta la fecha, solo unas pocas empresas tecnológicas de gran envergadura, como Apple, Amazon y Microsoft, habían tenido un acceso muy controlado a esta herramienta. Anthropic ha estado rechazando miles de solicitudes de otras compañías a nivel mundial, debido a la naturaleza potencialmente peligrosa de Claude Mythos.
Según el informe de Anthropic, la IA fue interceptada a través de un acceso no autorizado a uno de sus proveedores externos. Se sabe que el grupo responsable de la adquisición ha alardeado de su logro en un canal de Discord, aunque afirman no tener intenciones maliciosas y pretenden utilizar la IA para prevenir ataques, no para ejecutarlos.
El propósito fundamental de Claude Mythos es actuar como una IA experta en ciberseguridad, con la capacidad de identificar fallos de seguridad en sistemas operativos y navegadores. Su eficacia es notable: Mozilla ha confirmado que, gracias a la utilización de este modelo, logró detectar 271 vulnerabilidades en su navegador Firefox que aún no habían sido identificadas por su equipo humano.
Es importante aclarar que Claude Mythos no ha sido diseñada para crear virus. Su función es identificar las “puertas traseras” o debilidades en los sistemas que podrían ser explotadas por atacantes para acceder a la navegación o a los dispositivos de los usuarios. Empresas como Apple, Amazon y Microsoft la estaban utilizando precisamente para encontrar fallos en sus sistemas que sus equipos internos no habían detectado.
El principal riesgo radica en que una IA de este calibre, en las manos equivocadas, podría causar daños significativos. Con el conocimiento adecuado, podría analizar sistemas como Google Chrome, iOS, Android o Windows, y generar una lista de vulnerabilidades aún desconocidas y no explotadas. Esto representa una lista de “puertas abiertas” que podrían ser utilizadas para causar un gran perjuicio a prácticamente cualquier empresa tecnológica.
Anthropic ha proporcionado pocos detalles adicionales sobre la filtración, por lo que será necesario esperar a futuros comunicados. El hecho de que Mozilla haya descubierto tantas vulnerabilidades en pocos días con Claude Mythos subraya un nuevo temor en la industria: la posibilidad de que una IA de estas características se filtre y caiga en manos de cualquier persona. Como usuario, se podría utilizar para obtener listas de debilidades en tiendas en línea, por ejemplo, y explotar fallos con fines ilícitos.
Tradução para Português:
Anthropic alerta: Claude Mythos, sua IA de cibersegurança mais poderosa, em mãos erradas
A empresa de inteligência artificial Anthropic emitiu um aviso preocupante sobre seu último desenvolvimento: Claude Mythos, um modelo de linguagem especializado em cibersegurança e detecção de vulnerabilidades.
A Anthropic reconhece que tinha em mãos uma ferramenta de grande potencial, tanto para o bem quanto para o mal, e por isso decidiu restringir seu acesso há algumas semanas. No entanto, seus esforços de limitação não foram suficientes, pois recentemente a própria empresa comunicou que Claude Mythos caiu em “mãos erradas”, um fato que gera considerável inquietação.
Até o momento, apenas algumas empresas de tecnologia de grande porte, como Apple, Amazon e Microsoft, tiveram acesso muito controlado a essa ferramenta. A Anthropic tem rejeitado milhares de solicitações de outras empresas em todo o mundo, devido à natureza potencialmente perigosa do Claude Mythos.
De acordo com o relatório da Anthropic, a IA foi interceptada através de um acesso não autorizado a um de seus fornecedores externos. Sabe-se que o grupo responsável pela aquisição se gabou de sua conquista em um canal do Discord, embora afirmem não ter intenções maliciosas e pretendam usar a IA para prevenir ataques, não para executá-los.
O objetivo fundamental do Claude Mythos é atuar como uma IA especialista em cibersegurança, com a capacidade de identificar falhas de segurança em sistemas operacionais e navegadores. Sua eficácia é notável: a Mozilla confirmou que, graças ao uso deste modelo, conseguiu detectar 271 vulnerabilidades em seu navegador Firefox que ainda não haviam sido identificadas por sua equipe humana.
É importante esclarecer que Claude Mythos não foi projetado para criar vírus. Sua função é identificar as “portas dos fundos” ou fraquezas nos sistemas que poderiam ser exploradas por atacantes para acessar a navegação ou os dispositivos dos usuários. Empresas como Apple, Amazon e Microsoft a estavam utilizando justamente para encontrar falhas em seus sistemas que suas equipes internas não haviam detectado.
O principal risco reside no fato de que uma IA desse calibre, em mãos erradas, poderia causar danos significativos. Com o conhecimento adequado, poderia analisar sistemas como Google Chrome, iOS, Android ou Windows, e gerar uma lista de vulnerabilidades ainda desconhecidas e não exploradas. Isso representa uma lista de “portas abertas” que poderiam ser usadas para causar grande prejuízo a praticamente qualquer empresa de tecnologia.
A Anthropic forneceu poucos detalhes adicionais sobre o vazamento, portanto, será necessário aguardar futuros comunicados. O fato de a Mozilla ter descoberto tantas vulnerabilidades em poucos dias com Claude Mythos ressalta um novo temor na indústria: a possibilidade de que uma IA dessas características vaze e caia nas mãos de qualquer pessoa. Como usuário, poderia ser utilizada para obter listas de fraquezas em lojas online, por exemplo, e explorar falhas com fins ilícitos.
