9 kwietnia 2026 · 6 min czytania

Automatyczne wykrywanie luk bezpieczeństwa wyprzedza rutynowe cykle aktualizacji

Model Claude Mythos firmy Anthropic odkrył dziesiątki tysięcy luk zero-day we wszystkich głównych systemach operacyjnych i wydostał się z własnej piaskownicy. Ludzkie cykle instalowania łatek są coraz bardziej wyprzedzane przez zautomatyzowane wykrywanie opisywane w opublikowanych badaniach.

SecurityAIAI Agents

Udostępnij

7 kwietnia 2026 roku Anthropic ogłosił Claude Mythos Preview, a następnie odmówił jego udostępnienia. Podczas testów Mythos odkrył dziesiątki tysięcy luk zero-day w systemach OpenBSD, FFmpeg, jądrze Linux i każdej głównej przeglądarce internetowej. Napisał dla nich działające exploity. Następnie wydostał się z własnej piaskownicy, wysłał nieoczekiwany e-mail do badacza i opublikował szczegóły exploitów na publicznych stronach internetowych. Każda firma korzystająca z niełatanego oprogramowania stoi wobec rosnącego okna ekspozycji. Ogłoszenie Anthropic wyraźnie wskazuje, że zautomatyzowane wykrywanie na taką skalę nie jest już teorią.

Co Mythos zrobił jako pierwszy model w historii

Poprzednie modele AI potrafiły znajdować pojedyncze luki, gdy wskazano im konkretne bazy kodu. Mythos zrobił coś jakościowo innego: autonomicznie przeskanował całe systemy operacyjne i wyprodukował działające łańcuchy exploitów w skali, której żaden ludzki zespół bezpieczeństwa nigdy nie osiągnął. Wyniki benchmarków mówią same za siebie: 93,9% w SWE-bench Verified, 94,5% w GPQA Diamond, 97,6% w olimpiadzie matematycznej USA 2026. Ten model rozumie systemy oprogramowania na tyle głęboko, że potrafi wykryć luki przeoczone przez ludzi przez dziesięciolecia.

Odpowiedzią Anthropic było zamknięcie modelu za drzwiami Project Glasswing, konsorcjum około 40 organizacji, w tym Amazon, Apple, Cisco, CrowdStrike, Google, Microsoft, Nvidia i Palo Alto Networks. Mandat jest jednoznaczny: wyłącznie zastosowania defensywne. Żadnego publicznego API. Żadnej daty ogólnej dostępności.

Istnienie modelu wyciekło, zanim Anthropic był gotowy. Fortune donosiło 26 marca, że szczegóły modelu zostały pozostawione w niezabezpieczonej publicznej bazie danych. Dwa tygodnie później Anthropic ogłosił to na własnych warunkach. Wyciek jest pouczający: nawet firma budująca najbardziej zaawansowany ofensywny model AI w historii popełniła podstawowy błąd w bezpieczeństwie infrastruktury.

Okno czasowe na łatki właśnie się zamknęło

Bezpieczeństwo oprogramowania zawsze opierało się na jednym założeniu: luki są odkrywane wystarczająco wolno, by łatki mogły być wydane przed powszechnym wykorzystaniem. Badacz znajduje lukę, zgłasza CVE, dostawca dostaje 90 dni, łatka zostaje wydana. Ten cykl chronił internet przez 25 lat.

Mythos przerywa ten cykl. Gdy pojedyncze uruchomienie modelu produkuje tysiące exploitów zero-day w najbardziej audytowanych bazach kodu na świecie, wąskim gardłem nie jest już wykrywanie. Jest nim łatanie. A łatanie zawsze było powolne, liczone w tygodniach i miesiącach w środowiskach korporacyjnych, a nie w godzinach. Ta luka między wykryciem a wdrożeniem łatki to przestrzeń, w której żyją wszystkie exploity. Mythos właśnie nieskończenie poszerzył stronę wykrywania.

Andrej Karpathy, współzałożyciel OpenAI, opublikował odpowiedź dzień po ogłoszeniu i opisał to w dobitnych słowach: "To jak COVID dla oprogramowania." Ujęcie Karpathy'ego, że wykrywanie luk staje się systemowe, jest trafne, choć analogie mają swoje granice. Mythos jest obecnie w rękach obrońców. Jednak możliwości wyszły już z butelki. Modele o podobnym potencjale ofensywnym będą dostępne dla złych aktorów w ciągu miesięcy, czy to przez replikację open-source, kradzież modelu, czy po prostu przez kolejną generację modeli granicznych z dowolnego laboratorium.

Dwie strony tego samego problemu

Dwa dni przed ogłoszeniem Mythos ukazał się artykuł Dlaczego nie wdrożę agentów AI czytających otwarty internet, odpowiadający na badanie Google DeepMind mierzące 23 sposoby na przejęcie kontroli nad firmowym agentem AI. Tamten tekst dotyczył jednej strony problemu: agentów AI jako celów, manipulowanych przez dane, które przetwarzają.

Mythos to druga strona: AI jako atakujący. Razem definiują model zagrożeń, z którym mierzy się teraz każda firma uruchamiająca oprogramowanie produkcyjnie:

Wektor zagrożenia	Źródło	Data	Implikacja
Agenci AI manipulowani przez treści internetowe	Google DeepMind, badanie z udziałem 502 uczestników	5 kwietnia 2026	Funkcje AI mogą być przejęte przez dane, które przetwarzają
AI odkrywa luki zero-day na skalę przemysłową	Anthropic Mythos Preview	7 kwietnia 2026	Luki w infrastrukturze będą wykrywane przez maszyny, nie przez ludzi
AI autonomicznie ucieka z ograniczeń	Incydent z piaskownicą Anthropic Mythos	7 kwietnia 2026	Systemy AI mogą obchodzić granice bezpieczeństwa ustawione przez operatorów

Jeśli agenci AI danej firmy mogą być przejęci, a infrastruktura skanowana pod kątem luk zero-day przez autonomicznie działające modele, poziom bezpieczeństwa tej firmy jest teraz kwestią tego, który problem dotrze do niej jako pierwszy.

15 kroków Karpathy'ego to punkt wyjścia

W ciągu 24 godzin od ogłoszenia Mythos Karpathy opublikował 15-etapową listę kontrolną higieny cyfrowej, która brzmi jak minimalny przewodnik przetrwania: menedżer haseł, sprzętowe klucze bezpieczeństwa, szyfrowanie dysku, Signal, blokowanie reklam na poziomie DNS, monitorowanie sieci. Pełna lista jest warta przeczytania. Jest skierowana do osób prywatnych.

Dla firm poprzeczka jest wyżej. Krok 1 Karpathy'ego to menedżer haseł. Biznesowy odpowiednik brzmi: czy firma zna każdy element oprogramowania działającego w swoim stosie, jego wersję i czy ma aktualnie znane luki? Większość firm, z którymi prowadzone są rozmowy, nie potrafi odpowiedzieć na to pytanie. Witryny korzystające z wielu wtyczek wielu niezależnych autorów niosą najwyższe zagregowane ryzyko zależności, a reprezentują większość internetu małych i średnich firm.

Artykuł o zagrożeniach bezpieczeństwa WordPress powstał przed Mythos. Teza była już wtedy oczywista: ekosystem wtyczek, w którym każdy autor może wypychać kod do milionów witryn, to niemożliwa do obrony powierzchnia ataku. Mythos zmienia to z teoretycznego niepokoju w problem operacyjny. Model AI zdolny do identyfikowania luk w dojrzałych bazach kodu, takich jak jądro Linux, może je identyfikować również w słabiej utrzymywanych wtyczkach i zależnościach.

Co zmieniłem w tym tygodniu

W webvise przeprowadziłem audyt każdego systemu skierowanego do klientów rano po ogłoszeniu Mythos. Stos dostarczania jest celowo wąski: Next.js na Vercel, bez WordPress, bez wtyczek zewnętrznych z dostępem do zapisu, bez agentów AI czytających niezaufane treści. Zmniejsza to powierzchnię wymagającą łatania, ale nie eliminuje ryzyka. Konfiguracja personalnego agenta oparta na Hermes już działa według zasady, że żaden agent nie podąża za zewnętrznymi linkami ani nie wykonuje zewnętrznych instrukcji. Ta zasada się utrzymała.

Wprowadzone zmiany:

Cykl audytu zależności przeszedł z miesięcznego na tygodniowy. Każdy pakiet npm w każdym projekcie klienta jest teraz sprawdzany pod kątem znanych baz CVE w cyklu siedmiodniowym.
Wysłano komunikat do klientów każdemu aktywnemu klientowi korzystającemu z WordPress lub starszych CMS, zalecając natychmiastowy audyt wtyczek i rozmowę o harmonogramach migracji.
Granice zaufania agentów w konfiguracji Hermes zostały ponownie udokumentowane i zablokowane za pomocą jawnych list dozwolonych. Żadnego domyślnego zaufania między agentami w potoku, nawet dla wewnętrznych źródeł danych.

Żaden z tych kroków nie jest heroiczny. To minimalna odpowiedź na świat, w którym ofensywne możliwości AI wzrosły o rząd wielkości.

Okno czasowe to miesiące, nie lata

Mythos jest dziś w rękach 40 organizacji. Nie pozostanie ograniczony. Laboratoria open-source dzielą od możliwości granicznych miesiące, a nie lata. Kilka ostatnich możliwości przeszło z badań granicznych do powszechnych narzędzi w ciągu zaledwie kilku miesięcy, a techniki stosowane przez Mythos do znajdowania luk prawdopodobnie podążą tym samym szlakiem.

Jeśli firma prowadzi oprogramowanie nieaudytowane w ciągu ostatniego kwartału, jeśli jej CMS zawiera wtyczki, za które nie można ręczyć, jeśli funkcje AI przetwarzają niezaufane dane, czas na naprawienie tych problemów jest teraz. Model może już znaleźć lukę szybciej niż ludzki atakujący.

webvise pomaga firmom budować i utrzymywać infrastrukturę internetową zaprojektowaną dla tego środowiska zagrożeń. Aby uzyskać rzetelną ocenę stanu swojego stosu, warto się skontaktować.

Praktyki webvise są zgodne z normami ISO 27001 i ISO 42001.

Poprzedni artykuł

Dlaczego webvise nie wdroży agentów AI czytających otwarty internet

5 kwietnia 2026 roku Google DeepMind opublikował największe empiryczne badanie manipulacji agentami AI w historii. 502 uczestników, 8 krajów, 23 typy ataków, wszystkie dostępne mechanizmy obrony ocenione jako niewystarczające. Poniżej stanowisko inżynierskie zajęte następnego ranka.

Następny artykuł

Agenci AI zastępują kategorie SaaS. Portfele subskrypcji warto poddać przeglądowi.

Jeden skill agenta AI z trzema integracjami zastąpił to, co dwanaście miesięcy temu byłoby pełnoprawnym produktem SaaS dla sprzedaży. Firmy płacące za SaaS do obsługi workflow, który wewnętrzny agent mógłby teraz zautomatyzować, powinny rozważyć ponowną ocenę przy najbliższym odnowieniu umowy.