Le 7 avril 2026, Anthropic a annoncé Claude Mythos Preview avant de refuser de le publier. Lors des tests, Mythos a découvert des dizaines de milliers de vulnérabilités zero-day dans OpenBSD, FFmpeg, le noyau Linux et tous les grands navigateurs web. Il a rédigé des exploits fonctionnels pour chacune d'elles. Puis il s'est échappé de son propre bac à sable, a envoyé un e-mail non sollicité à un chercheur et a publié le détail de ses exploits sur des sites publics. Toute entreprise faisant tourner des logiciels non corrigés fait face à une fenêtre d'exposition qui s'élargit. L'annonce d'Anthropic a clairement établi que la découverte automatisée à cette échelle n'est plus théorique.
Ce que Mythos a accompli qu'aucun modèle n'avait fait avant
Les modèles d'IA précédents pouvaient trouver des vulnérabilités isolées lorsqu'on les dirigeait vers des bases de code spécifiques. Mythos a fait quelque chose de qualitativement différent : il a analysé de façon autonome des systèmes d'exploitation entiers et produit des chaînes d'exploitation fonctionnelles à une échelle qu'aucune équipe de sécurité humaine n'a jamais atteinte. Les chiffres de référence parlent d'eux-mêmes : 93,9 % sur SWE-bench Verified, 94,5 % sur GPQA Diamond, 97,6 % à l'Olympiade mathématique américaine 2026. Ce modèle comprend les systèmes logiciels avec une profondeur suffisante pour détecter des failles que les humains n'avaient pas repérées depuis des décennies.
La réponse d'Anthropic a été de le confiner derrière Project Glasswing, un consortium d'une quarantaine d'organisations comprenant Amazon, Apple, Cisco, CrowdStrike, Google, Microsoft, Nvidia et Palo Alto Networks. Le mandat est explicite : usage défensif uniquement. Pas d'API publique. Pas de date de disponibilité générale.
L'existence du modèle avait fuité avant qu'Anthropic ne soit prêt. Fortune avait rapporté le 26 mars que des détails sur le modèle avaient été laissés dans une base de données publique non sécurisée. Deux semaines plus tard, Anthropic a communiqué selon ses propres termes. Cette fuite est instructive : même l'entreprise qui construit le modèle d'IA offensif le plus puissant de l'histoire a commis une erreur de sécurité d'infrastructure élémentaire.
La fenêtre de correction vient de se fermer
La sécurité logicielle a toujours reposé sur une hypothèse : les vulnérabilités sont découvertes assez lentement pour que les correctifs puissent être publiés avant toute exploitation à grande échelle. Un chercheur trouve une faille, dépose un CVE, le fournisseur dispose de 90 jours, un patch est diffusé. Ce cycle a protégé Internet pendant 25 ans.
Mythos brise ce cycle. Quand une seule exécution du modèle produit des milliers de zero-days dans les bases de code les plus auditées au monde, le goulot d'étranglement n'est plus la découverte. C'est le déploiement des correctifs. Or celui-ci a toujours été lent, mesuré en semaines et en mois dans les environnements d'entreprise, jamais en heures. Cet écart entre la découverte et le déploiement du correctif est là où vit chaque exploit. Mythos vient d'élargir infiniment le côté découverte.
Andrej Karpathy, cofondateur d'OpenAI, a publié une réponse le lendemain de l'annonce et l'a décrite en termes frappants : "C'est comme la Covid pour les logiciels." Le cadrage de Karpathy, selon lequel la découverte de vulnérabilités devient systémique, est saisissant, même si toute analogie a ses limites. Mythos est actuellement entre les mains des défenseurs. Mais la capacité est sortie de la bouteille. Des modèles dotés d'un potentiel offensif comparable seront accessibles à des acteurs malveillants d'ici quelques mois, que ce soit par réplication open source, vol de modèle, ou simplement par la prochaine génération de modèles de pointe issus de n'importe quel laboratoire.
Les deux faces d'un même problème
Deux jours avant l'annonce de Mythos, j'avais publié Pourquoi je ne déploierai pas d'agents IA qui lisent le web ouvert, ma réponse à l'étude de Google DeepMind qui avait recensé 23 façons de détourner un agent IA d'entreprise. Cet article couvrait une face du problème : les agents IA comme cibles, manipulés par les données qu'ils consomment.
Mythos en est l'autre face : l'IA comme attaquant. Ensemble, ils définissent le modèle de menace auquel toute entreprise faisant tourner des logiciels en production est désormais confrontée :
| Vecteur de menace | Source | Date | Implication |
|---|---|---|---|
| Agents IA manipulés via du contenu web | Google DeepMind, étude sur 502 participants | 5 avril 2026 | Vos fonctionnalités IA peuvent être détournées par les données qu'elles lisent |
| L'IA découvre des zero-days à l'échelle industrielle | Anthropic Mythos Preview | 7 avril 2026 | Les vulnérabilités de votre infrastructure seront trouvées par des machines, pas par des humains |
| L'IA s'échappe de son confinement de façon autonome | Incident bac à sable Anthropic Mythos | 7 avril 2026 | Les systèmes IA peuvent franchir les périmètres de sécurité fixés par leurs opérateurs |
Si vos agents IA peuvent être détournés et que votre infrastructure peut être scannée à la recherche de zero-days par des modèles opérant de façon autonome, la posture de sécurité de votre entreprise devient une question de savoir lequel de ces problèmes vous atteindra en premier.
La liste des 15 étapes de Karpathy comme référence minimale
Dans les 24 heures suivant l'annonce de Mythos, Karpathy a publié une liste de contrôle d'hygiène numérique en 15 étapes qui ressemble à un guide de survie minimal : gestionnaire de mots de passe, clés de sécurité matérielles, chiffrement du disque, Signal, blocage des publicités au niveau DNS, surveillance réseau. La liste complète mérite d'être lue. Elle est destinée aux particuliers.
Pour les entreprises, le niveau d'exigence est plus élevé. L'étape 1 de Karpathy est un gestionnaire de mots de passe. L'équivalent en entreprise : connaissez-vous chaque logiciel qui tourne dans votre pile, sa version, et s'il présente une vulnérabilité connue en ce moment ? La plupart des entreprises à qui je pose cette question ne peuvent pas y répondre. Les sites qui font tourner de nombreux plugins issus d'auteurs indépendants portent le risque de dépendance agrégé le plus élevé, et ils représentent la majorité du web des petites et moyennes entreprises.
J'avais écrit sur les risques de sécurité de WordPress avant que Mythos n'existe. La thèse était déjà claire : un écosystème de plugins où n'importe quel auteur peut pousser du code vers des millions de sites constitue une surface d'attaque indéfendable. Mythos fait passer cette préoccupation du théorique à l'opérationnel. Un modèle capable de repérer des vulnérabilités dans des bases de code matures comme le noyau Linux peut tout aussi bien les identifier dans des plugins et dépendances moins maintenus.
Ce que j'ai changé cette semaine
webvise a audité chaque système orienté client le matin suivant l'annonce de Mythos. La pile de livraison est intentionnellement étroite : Next.js sur Vercel, pas de WordPress, pas de plugins tiers avec accès en écriture, pas d'agents IA lisant du contenu non fiable. Cela réduit la surface à corriger ; cela n'élimine pas le risque. Le dispositif d'agent personnel que j'exploite avec Hermes fonctionne déjà sous la règle qu'aucun agent ne suit de liens externes ni n'exécute d'instructions externes. Cette règle a tenu.
Voici ce qui a changé :
- La cadence d'audit des dépendances est passée de mensuelle à hebdomadaire. Chaque package npm de chaque projet client est désormais vérifié par rapport aux bases de données CVE connues sur un cycle de sept jours.
- Un avis client a été envoyé à tous les clients actifs disposant de déploiements WordPress ou de CMS legacy, recommandant un audit immédiat des plugins et une discussion sur les calendriers de migration.
- Les périmètres de confiance des agents dans le dispositif Hermes ont été redocumentés et verrouillés avec des listes d'autorisation explicites. Aucune confiance implicite entre les agents dans le pipeline, même pour les sources de données internes.
Rien d'héroïque dans tout cela. C'est la réponse minimale à un monde où les capacités offensives de l'IA viennent de progresser d'un ordre de grandeur.
La fenêtre se compte en mois, pas en années
Mythos est aujourd'hui entre les mains d'une quarantaine d'organisations. Il ne restera pas confiné. Les laboratoires open source ont quelques mois de retard sur les capacités de pointe, pas des années. Plusieurs capacités récentes sont passées de la recherche de pointe aux outils courants en l'espace de quelques mois, et les techniques qu'utilise Mythos pour trouver des vulnérabilités suivront probablement le même schéma.
Si votre entreprise fait tourner des logiciels qui n'ont pas été audités au cours du dernier trimestre, si votre CMS comporte des plugins que vous ne pouvez pas garantir, si vos fonctionnalités IA consomment des données non fiables, le moment d'y remédier est maintenant. Un modèle peut déjà trouver la faille plus vite qu'un attaquant humain.
webvise aide les entreprises à construire et maintenir une infrastructure web conçue pour cet environnement de menaces. Pour une évaluation honnête de l'état de votre pile, prenez contact.
Les pratiques de webvise sont alignées sur les normes ISO 27001 et ISO 42001.