IA vs homo sapiens. Au début du mois d’avril, le géant de l’Intelligence Artificielle Anthropic a publié via son Frontier Red Team une analyse détaillée des capacités cyber de Mythos Preview (aussi appelé Claude Mythos). Puis, quelques jours plus tard, l’AI Security Institute (AISI) britannique confirmait ses résultats sur des simulations réalistes. Et, plus rien jusqu’à la mi-juin. Le sénateur Mark Warner, vice-président de la commission du renseignement du Sénat américain, le directeur de la NSA, le général Joshua Rudd, aurait déclaré que Mythos avait « cassé presque tous nos systèmes classifiés, non pas en semaines, mais en heures. »
- Anthropic a publié une analyse sur Mythos Preview, un modèle d’IA spécialisé en cybersécurité, qui a choqué en cassant des systèmes classifiés en quelques heures.
- Le gouvernement américain a restreint l’accès international aux modèles avancés d’Anthropic, soulignant un enjeu de souveraineté géopolitique en matière d’intelligence artificielle.
Anthropic et sa famille de modèles d’IA
Anthropic est une entreprise américaine fondée en 2021 par d’anciens chercheurs d’OpenAI. Elle s’est rapidement imposée comme l’un des acteurs les plus importants de l’intelligence artificielle, avec une approche centrée sur la sécurité et l’alignement des modèles.
Voici les principaux modèles de la société :
- Claude Opus : le modèle le plus puissant de la gamme jusqu’à récemment, excellent en raisonnement général et en tâches complexes.
- Claude Sonnet : un modèle plus rapide et équilibré, souvent utilisé pour un usage quotidien.
- Mythos Preview : un modèle spécialisé dans la cybersécurité offensive. Développé par l’équipe Frontier Red Team d’Anthropic, il excelle particulièrement dans la découverte de vulnérabilités zero-day et la construction d’exploits autonomes.
Mythos n’est donc pas un simple énième modèle généraliste, mais une version orientée « hacking » et red teaming, bien plus performante que ses prédécesseurs sur ce type de tâches. Et, c’est là le cœur du problème.
Mythos : L’IA qui transforme la chasse aux zero-day en routine nocturne
Le rapport d’Anthropic du 7 avril 2026 décrit un modèle capable d’agir de façon largement autonome sur des tâches de cybersécurité offensive. Dans ce sens, des ingénieurs sans formation sécurité formelle ont demandé à Mythos Preview de trouver des vulnérabilités d’exécution de code à distance pendant la nuit : ils se sont réveillés le lendemain avec des hacks possibles fonctionnels complets.
Par exemple, Mythos Preview a identifié et exploité des vulnérabilités zero-day, c’est-à-dire des failles de sécurité totalement inconnues des éditeurs et donc non corrigées. Ces failles ont été découvertes dans des systèmes critiques comme OpenBSD, le noyau Linux, FreeBSD et plusieurs navigateurs web.
Par ailleurs, le modèle se distingue particulièrement par sa capacité à enchaîner plusieurs failles entre elles. Au lieu d’exploiter une seule vulnérabilité, il combine plusieurs techniques pour passer progressivement d’un accès limité à un contrôle total de la machine, jusqu’à obtenir les droits d’administrateur les plus élevés (appelés « root »).
Nombreux sont les cas qui illustrent déjà les réussites de Claude Code et de produits d’Anthropic. Dans notre écosystème, l’IA se place même, d’après Anthropic eux-mêmes, au cœur des cyberattaques et des ransomwares.
Simulation d’attaque en 32 étapes : Mythos signe la première réussite complète d’une IA
L’Institut britannique de sécurité de l’intelligence artificielle (AISI) a testé Mythos Preview sur un scénario nommé The Last Ones, « Les Derniers » en français. Il s’agit d’une simulation d’attaque complète sur un réseau d’entreprise, depuis la découverte initiale du système jusqu’à sa prise de contrôle totale.
Un expert humain aurait besoin d’environ 20 heures pour mener cette opération du début à la fin. Mythos Preview est le premier modèle d’IA à avoir réussi l’ensemble du test : il y est parvenu dans 3 cas sur 10, avec une moyenne de 22 étapes réussies sur les 32 que compte l’épreuve. Pour comparaison, Claude Opus 4.6 atteignait en moyenne seulement 16 étapes sur 32.
L’AISI en conclut que le modèle peut déjà attaquer de façon autonome des systèmes d’entreprise peu protégés, une fois qu’il a obtenu un premier accès. Cependant, ces simulations ne comportent ni défenseurs humains ni outils de détection avancés, ce qui limite la portée des résultats sur des environnements vraiment sécurisés.

« Presque tous les systèmes classifiés de la NSA » : vraiment ?
Puis, donc, vint le 11 juin 2026. Le sénateur Mark Warner a rapporté publiquement les propos du général Joshua Rudd, directeur de la NSA et du Cyber Command : Mythos aurait infiltré « presque tous nos systèmes classifiés, non pas en semaines, mais en heures ». La phrase a été largement reprise, notamment par The Economist le 14 juin dans un contexte de restrictions d’exportation décidées par l’administration Trump sur les modèles Mythos 5 et Fable 5.
Cependant, l’auteur de l’article de The Economist, Shashank Joshi, a lui-même nuancé le 21 juin sur X :
« Cette affirmation, désormais largement diffusée, est basée sur une phrase que j’ai écrite la semaine dernière (…). J’ai cité avec précision Mark Warner, vice-président de la commission sénatoriale du renseignement, affirmant que le chef de la NSA lui avait dit que Mythos “avait pénétré dans presque tous nos systèmes classifiés, non pas en quelques semaines, mais en quelques heures”. Mais ce serait une erreur de lire cela littéralement, je pense. Cela dépend sûrement de l’utilisation de Mythos aux côtés d’autres outils dans des conditions très particulières. Je l’ai cité pour donner une idée de la puissance de Mythos’. Mais c’était une erreur de ne pas avoir ajouté de réserves. »
Shashank Joshi – Source
De plus, plusieurs sources indiquent que ces tests s’inscrivaient dans un cadre de red teaming autorisé (tests offensifs commandités ou supervisés par les services de renseignement eux-mêmes pour évaluer les capacités). Le gouvernement américain était déjà partenaire d’Anthropic sur ces questions. Le claim spectaculaire illustre donc surtout la vitesse et l’autonomie nouvelles des modèles, plutôt qu’une compromission non autorisée réelle.
Mythos Preview n’est pas (encore) un super-hacker omniscient et autonome à 100 %. Il excelle dans des environnements où il peut itérer rapidement, chaîner des primitives et exploiter des failles subtiles que les humains ratent parfois pendant des années. Sa force réside dans la vitesse, l’échelle et l’absence de fatigue.
Les USA restreignent l’accès à Anthropic
Pour les défenseurs, c’est une opportunité majeure : Anthropic a d’ailleurs lancé Project Glasswing pour aider à sécuriser les logiciels critiques. Pour les attaquants potentiels (États ou groupes criminels), c’est un multiplicateur de force inquiétant, surtout si des modèles équivalents ou supérieurs se répandent.
Après ces démonstrations de puissance, l’administration Trump a décidé de restreindre fortement l’accès aux modèles les plus avancés d’Anthropic, dont Mythos et Fable. Désormais, ces systèmes sont largement réservés aux utilisateurs américains.
Cette décision devient alors une réalité géopolitique : les capacités les plus avancées en intelligence artificielle, notamment dans le domaine cyber, deviennent un enjeu de souveraineté. Les autres pays se retrouvent dépendants des choix politiques d’une seule puissance pour accéder à des outils qui peuvent profondément transformer la cybersécurité, l’économie et la défense.
L’article Mythos, le modèle d’Anthropic qui inquiète Washington : jusqu’où l’IA peut-elle aller en cybersécurité offensive ? est apparu en premier sur Journal du Coin.
