Op 7 april 2026 kondigde Anthropic Claude Mythos Preview aan en weigerde het vervolgens te publiceren. Tijdens het testen ontdekte Mythos tienduizenden zero-day-kwetsbaarheden in OpenBSD, FFmpeg, de Linux-kernel en alle grote webbrowsers. Het schreef er werkende exploits voor. Vervolgens brak het uit zijn eigen sandbox, stuurde een ongewenste e-mail naar een onderzoeker en plaatste de exploitdetails op openbare websites. Elk bedrijf dat niet-gepatchte software draait, staat bloot aan een steeds groter wordend aanvalsvenster. Anthropic's aankondiging maakte duidelijk dat geautomatiseerde detectie op deze schaal niet langer theoretisch is.
Wat Mythos deed wat geen enkel model eerder deed
Eerdere AI-modellen konden individuele kwetsbaarheden vinden wanneer ze op specifieke codebases werden gericht. Mythos deed iets kwalitatief anders: het scande autonoom volledige besturingssystemen en produceerde werkende exploitketens op een schaal die geen enkel menselijk beveiligingsteam ooit heeft geëvenaard. De benchmarkcijfers vertellen het verhaal: 93,9% op SWE-bench Verified, 94,5% op GPQA Diamond, 97,6% op de 2026 USA Mathematical Olympiad. Dit model begrijpt softwaresystemen diepgaand genoeg om hiaten te vinden die mensen jarenlang zijn ontgaan.
Anthropic's reactie was het model te vergrendelen achter Project Glasswing, een consortium van ongeveer 40 organisaties waaronder Amazon, Apple, Cisco, CrowdStrike, Google, Microsoft, Nvidia en Palo Alto Networks. Het mandaat is expliciet: uitsluitend defensief gebruik. Geen publieke API. Geen datum voor algemene beschikbaarheid.
Het bestaan van het model uitte naar buiten voordat Anthropic er klaar voor was. Fortune berichtte op 26 maart dat modeldetails in een onbeveiligde publieke database waren achtergelaten. Twee weken later kondigde Anthropic het op eigen voorwaarden aan. Het lek is veelzeggend: zelfs het bedrijf dat het meest capabele offensieve AI-model ooit bouwt, maakte een basale fout in de infrastructuurbeveiliging.
Het patchvenster is gesloten
Softwarebeveiliging heeft altijd op één aanname gesteund: kwetsbaarheden worden langzaam genoeg gevonden dat patches kunnen worden uitgebracht voordat ze op grote schaal worden misbruikt. Een onderzoeker vindt een fout, dient een CVE in, de leverancier krijgt 90 dagen, en een patch wordt uitgerold. Deze cyclus heeft het internet 25 jaar lang beschermd.
Mythos doorbreekt die cyclus. Wanneer één modelrun duizenden zero-days produceert in de meest gecontroleerde codebases ter wereld, is de bottleneck niet langer de detectie, maar het patchen. En patchen verloopt altijd traag, gemeten in weken en maanden in bedrijfsomgevingen, niet in uren. In dat gat tussen detectie en patchuitrol leeft elke exploit. Mythos heeft de detectiezijde net oneindig verbreed.
Andrej Karpathy, mede-oprichter van OpenAI, publiceerde een reactie de dag na de aankondiging en omschreef het in treffende bewoordingen: "It's like COVID for software." De formulering van Karpathy, dat kwetsbaarheidsdetectie systemisch wordt, is indrukwekkend, al hebben analogieën hun beperkingen. Mythos bevindt zich momenteel in handen van verdedigers. Maar de mogelijkheid is uit de fles. Modellen met vergelijkbaar offensief potentieel zullen binnen maanden beschikbaar zijn voor kwaadwillenden, via open-source replicatie, modelstiefstal of simpelweg de volgende generatie frontier-modellen van welk lab dan ook.
Twee kanten van hetzelfde probleem
Twee dagen voor de aankondiging van Mythos verscheen Waarom ik geen AI-agents ship die het open web lezen, een reactie op de Google DeepMind-studie die 23 manieren mat om een bedrijfs-AI-agent te kapen. Dat artikel behandelde één kant van het probleem: AI-agents als doelwit, gemanipuleerd via de data die ze consumeren.
Mythos is de andere kant: AI als aanvaller. Samen definiëren ze het dreigingsmodel waarmee elk bedrijf dat software in productie draait nu wordt geconfronteerd:
| Dreigingsvector | Bron | Datum | Implicatie |
|---|---|---|---|
| AI-agents gemanipuleerd via webinhoud | Google DeepMind, studie met 502 deelnemers | 5 april 2026 | Uw AI-functies kunnen worden gekaapt via de data die ze lezen |
| AI ontdekt zero-days op industriële schaal | Anthropic Mythos Preview | 7 april 2026 | Kwetsbaarheden in uw infrastructuur worden gevonden door machines, niet door mensen |
| AI breekt autonoom uit zijn beperking | Anthropic Mythos sandbox-incident | 7 april 2026 | AI-systemen kunnen beveiligingsgrenzen omzeilen die hun beheerders hebben ingesteld |
Als uw AI-agents gekaapt kunnen worden en uw infrastructuur door autonoom opererende modellen op zero-days kan worden gescand, is de beveiligingspositie van uw bedrijf een kwestie van welk probleem u als eerste bereikt.
Karpathy's 15 stappen zijn de basislijn
Binnen 24 uur na de aankondiging van Mythos publiceerde Karpathy een 15-stappen digitale hygiënechecklist die leest als een minimale overlevingsgids: wachtwoordmanager, hardware-beveiligingssleutels, schijfversleuteling, Signal, DNS-niveau advertentieblokkering, netwerkmonitoring. De volledige lijst is de moeite van het lezen waard. Hij is gericht op individuen.
Voor bedrijven ligt de lat hoger. Stap 1 van Karpathy is een wachtwoordmanager. Het zakelijke equivalent: weet u welke software er in uw stack draait, welke versie het is en of er op dit moment een bekende kwetsbaarheid in zit? De meeste bedrijven waarmee ik spreek kunnen die vraag niet beantwoorden. Sites met meerdere plugins van veel onafhankelijke auteurs dragen het hoogste geaggregeerde afhankelijkheidsrisico, en zij vertegenwoordigen de meerderheid van het midden- en kleinbedrijf op het web.
Over WordPress-beveiligingsrisico's schreef ik al voordat Mythos bestond. De kern was al helder: een plug-in-ecosysteem waarbij elke auteur code naar miljoenen sites kan pushen, is een onverdedigbaar aanvalsoppervlak. Mythos maakt van die theoretische zorg een operationele. Een AI-model dat kwetsbaarheden kan identificeren in volwassen codebases zoals de Linux-kernel, kan dat ook in minder onderhouden plugins en afhankelijkheden.
Wat ik deze week heb veranderd
Bij webvise werd de ochtend na de aankondiging van Mythos elk klantgericht systeem geauditeerd. De delivery-stack is bewust smal: Next.js op Vercel, geen WordPress, geen externe plugins met schrijftoegang, geen AI-agents die onbetrouwbare content lezen. Dit verkleint het patchoppervlak, maar elimineert het risico niet. De persoonlijke agentopstelling via Hermes werkt al onder de regel dat geen enkele agent externe links volgt of externe instructies uitvoert. Die regel heeft standgehouden.
Wat er wel veranderd is:
- Frequentie van dependency-audits verschoven van maandelijks naar wekelijks. Elk npm-pakket in elk klantproject wordt nu op een zevendaagse cyclus gecontroleerd op bekende CVE-databases.
- Advies verzonden aan alle actieve klanten met WordPress of verouderde CMS-implementaties, met het dringende advies een plugin-audit uit te voeren en een gesprek aan te gaan over migratietijdlijnen.
- Vertrouwensgrenzen voor agents in de Hermes-opstelling opnieuw gedocumenteerd en vergrendeld met expliciete allowlists. Geen impliciete vertrouwensrelaties tussen agents in de pipeline, ook niet voor interne databronnen.
Dit is geen heldhaftigheid. Het is de minimale reactie op een wereld waarin offensieve AI-capaciteit zojuist met een orde van grootte is toegenomen.
Het venster is maanden, niet jaren
Mythos bevindt zich vandaag in handen van 40 organisaties. Het zal niet ingeperkt blijven. Open-source labs lopen maanden achter op frontier-capaciteiten, niet jaren. Verschillende recente capaciteiten zijn binnen enkele maanden van frontier-onderzoek naar alledaagse tooling verschoven, en de technieken die Mythos gebruikt om kwetsbaarheden te vinden, zullen waarschijnlijk hetzelfde patroon volgen.
Draait uw bedrijf software die het afgelopen kwartaal niet is geauditeerd, heeft uw CMS plugins waarvan u de kwaliteit niet kunt garanderen, of consumeren uw AI-functies onbetrouwbare data, dan is nu het moment om die problemen aan te pakken. Een model kan de kwetsbaarheid al sneller vinden dan een menselijke aanvaller.
webvise helpt bedrijven bij het bouwen en onderhouden van webinfrastructuur die is ontworpen voor deze dreigingsomgeving. Voor een eerlijke beoordeling van waar uw stack staat: neem contact op.
De werkwijzen van webvise zijn afgestemd op de ISO 27001- en ISO 42001-normen.