Anthropic’s Claude Mythos Preview: 73% Erfolgsquote bei Expert-Level-Hacking-Challenges – Der Durchbruch in der autonomen Cybersicherheit
Können KIs bald komplexe Cyberangriffe autonom durchführen, wo menschliche Hacker Wochen brauchen? Anthropics Claude Mythos Preview hat genau das geschafft: Eine Erfolgsquote von 73 % bei Experten-Level-Capture-the-Flag-Challenges (CTF) und die Fähigkeit, 32-stufige Netzwerk-Infiltrationen zu meistern. Dieser Meilenstein, bestätigt durch das britische AI Security Institute (ASI), verschiebt die Grenzen der KI in der Cybersecurity. Tech-Giganten wie Microsoft oder Google könnten von solchen Tools profitieren, während Sicherheitsfirmen wie CrowdStrike unter Druck geraten – Aktiengewinne für Anthropic, potenzielle Verluste für traditionelle Pentesting-Anbieter.
Die bahnbrechenden Test-Ergebnisse von Claude Mythos Preview
Das Modell wurde in der ASI-Simulation The Last Ones (TLO) getestet, einer 32-stufigen Nachstellung eines Unternehmensnetzwerks von Reconnaissance bis zur vollständigen Übernahme. Erfahrene Penetrationstester benötigen dafür etwa 20 Stunden. Claude Mythos Preview schloss in drei von zehn Versuchen alle Schritte autonom ab und erreichte im Schnitt 22 von 32 Schritten – doppelt so gut wie das Vorgängermodell Claude Opus 4.6 mit 16 Schritten.
Bei CTF-Challenges auf Expertenniveau, die kreatives Problemlösen erfordern, knackte das Modell 73 % der Aufgaben. Vor 2025 war kein KI-Modell fähig, diese zu lösen. Diese Zahlen stammen aus einer umfassenden Evaluierung des ASI, die den Übergang von passiver zu aktiver Autonomie markiert.
- Autonome Angriffsketten: Mythos plant und führt mehrstufige Attacken ohne menschliches Eingreifen.
- Vergleich zu Menschen: Automatisiert Wochenarbeit in Stunden.
- Historischer Sprung: Erstes Modell, das Expert-Level-CTFs dominiert.
Technische Fähigkeiten und interne Entwicklungen bei Anthropic
Claude Mythos entstand nicht gezielt für Hacking, sondern durch Training auf Programmieraufgaben. Es analysiert riesige Codebasen wie Linux oder Firefox und findet Schwachstellen, die jahrelang unentdeckt blieben. Ein Leak via ungesichertem Datendepot offenbarte Project Glasswing, das nur Tech-Giganten Zugang gewährt, um kritische Software vor eigener KI zu schützen. Am 7. April 2026 startete die geschlossene Testphase.
Neuer Wissenspunkt: Mythos zeigt tiefes Verständnis für Netzwerklogik und umgeht Schutzmechanismen kreativ. Ein weiterer: Es testet Tausende Varianten schneller als Menschen, was Angriffe skalierbar macht. Drittens: Anthropics System Card dokumentiert niedrigere Hacking-Raten bei unmöglichen Problemen, unterstreicht aber reale Fortschritte.
Risiken und Expertenmeinungen
ETH-Professor Florian Tramèr warnt: Mit Claude Mythos hat ein einzelner Hacker plötzlich viel mehr Angriffsmöglichkeiten. Weniger erfahrene Angreifer nutzen KI für gezielte Attacken. Dennoch: Von Bug-Fund bis Exploit sind Schritte komplex. Tramèr betont, dass Software-Updates und Zugriffsrechte entscheidend bleiben, doch Angriffe werden raffinierter.
- Positiv: Frühe Lückenfindung macht Software sicherer.
- Negativ: Sinkende Einstiegshürde für Kriminelle.
- Beispiel: Mythos fand in Firefox und Linux kritische Bugs.
In einer Channel-Transformation wie beim ADN Transformation Day wird KI-Security zum Treiber.
Vor- und Nachteile für die Wirtschaft sowie Zukunftsausblick
Vorteile: Kosteneinsparungen bei Pentests – Unternehmen sparen Wochen manueller Arbeit. Schnellere Bugfixes steigern Softwarequalität, profitieren Cloud-Anbieter und Entwickler. Wirtschaftswachstum durch effizientere Cybersicherheit, geschätzt Milliarden in vermiedenen Breaches.
Nachteile: Erhöhtes Risiko automatisierter Angriffe belastet Versicherer und Banken. Jobverdrängung für Pentester, steigende Investitionen in Defense-KIs belasten Mittelstand.
Zukunft: Erwarten Sie Open-Source-Varianten bis 2027, regulatorische Hürden wie in der Trump-KI-Politik. Entwicklung zu defensiven Super-KIs, die Angriffe vorhersagen. Bis 2030 könnten 80 % der Breaches KI-gestützt sein, mit Gegenmaßnahmen wie Project Glasswing-ähnlichen Initiativen.
Empfehlung: Unternehmen sollten sofort KI-gestützte Security-Tools evaluieren, Patches priorisieren und in hybride Teams investieren – der Wettlauf zwischen Offensive und Defensive hat begonnen. Testen Sie Modelle wie Mythos intern, um Vorsprung zu sichern.


Kommentar abschicken