AI Coding, Allgemein, KI News, Technologie

Anthropic stellt Claude Mythos vor — und jagt damit Sicherheitslücken in jeder großen Software

Anthropic hat mit Project Glasswing und dem neuen Modell Claude Mythos Preview die Cybersecurity-Branche aufgemischt. Das Modell findet Zero-Day-Lücken in jedem großen Betriebssystem und Browser — autonom, ohne menschliche Hilfe. Was das für Unternehmen bedeutet.

Anthropic hat gerade etwas veröffentlicht, das größer ist als jedes neue Chatbot-Feature. Project Glasswing ist eine Initiative mit Amazon, Apple, Google, Microsoft, NVIDIA, CrowdStrike, Cisco, Palo Alto Networks und weiteren Schwergewichten. Das Ziel: die kritischste Software der Welt absichern. Und das Werkzeug dafür ist ein neues Frontier-Modell namens Claude Mythos Preview.

Mythos ist kein normales Update. Es ist das erste AI-Modell, das beim Finden und Ausnutzen von Softwareschwachstellen mit den besten menschlichen Security-Experten mithalten kann. In manchen Fällen übertrifft es sie.

Was Claude Mythos gefunden hat

Inhaltsangabe

In den letzten Wochen hat Anthropic Mythos Preview auf echte Software losgelassen. Das Ergebnis: Tausende bisher unbekannte Zero-Day-Schwachstellen. In jedem großen Betriebssystem. In jedem großen Browser. Und in einer Reihe weiterer kritischer Systeme.

Ein Anthropic-Forscher bringt es im offiziellen Video auf den Punkt: «I found more bugs in the last couple of weeks than I found in the rest of my life combined.» Das ist kein Marketing-Spruch. Das ist ein Security-Researcher der seit Jahren Schwachstellen sucht.

Drei Beispiele stechen heraus. Mythos hat eine 27 Jahre alte Lücke in OpenBSD gefunden — einem der sichersten Betriebssysteme der Welt, das für Firewalls und kritische Infrastruktur genutzt wird. Zwei Datenpakete an einen beliebigen OpenBSD-Server schicken, und die Maschine stürzt ab. 27 Jahre lang hat das niemand gefunden.

Dann eine 16 Jahre alte Lücke in FFmpeg, der Software die fast jedes Video-Tool auf dem Planeten nutzt. Automatisierte Testtools hatten die betroffene Codezeile fünf Millionen Mal durchlaufen, ohne das Problem zu erkennen. Mythos hat es beim ersten Durchgang gefunden.

Und im Linux-Kernel hat das Modell autonom mehrere Schwachstellen gefunden und sie zu einer Exploit-Kette kombiniert. Vom normalen Nutzerzugang zur vollen Kontrolle über die Maschine. Ohne menschliche Hilfe. Das Anthropic-Team erklärt: Das Modell kann drei, vier, manchmal fünf Schwachstellen verketten, die einzeln harmlos sind, aber zusammen einen hochkomplexen Angriff ermöglichen.

Warum Mythos so gut darin ist

Anthropic hat Mythos nicht gezielt für Cybersecurity trainiert. Sie haben es trainiert, gut im Programmieren zu sein. Und als Nebeneffekt davon ist es auch gut im Finden von Sicherheitslücken. Jedes zukünftige Coding-Modell wird diese Fähigkeiten mitbringen.

Was Mythos besonders macht, ist seine Autonomie. Das Modell verfolgt langfristige Aufgaben so, wie ein menschlicher Security-Researcher einen ganzen Arbeitstag lang an einem Problem arbeiten würde. Es braucht keine ständige Anleitung.

Die Benchmarks

Mythos Preview schlägt Claude Opus 4.6 in fast allen relevanten Benchmarks deutlich. Auf SWE-bench Verified erreicht es 93,9% gegenüber 80,8% bei Opus. Bei SWE-bench Pro sind es 77,8% gegen 53,4%. Bei Terminal-Bench 2.0 kommt Mythos auf 82%, Opus auf 65,4%.

Auf dem Cybersecurity-Benchmark CyberGym schafft Mythos 83,1% gegen 66,6% bei Opus. Das ist kein inkrementelles Update. Das ist ein Generationssprung.

Auch bei Reasoning-Benchmarks legt Mythos vor. GPQA Diamond: 94,6%. Humanity’s Last Exam mit Tools: 64,7% gegen 53,1% bei Opus. Und bei BrowseComp erreicht es 86,9% mit 4,9-mal weniger Tokens als Opus.

Wer bei Project Glasswing mitmacht

Die Partnerliste liest sich wie das Who’s Who der Tech-Industrie. AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, die Linux Foundation, Microsoft, NVIDIA und Palo Alto Networks. Dazu über 40 weitere Organisationen die kritische Software-Infrastruktur bauen oder warten.

Anthropic stellt bis zu 100 Millionen Dollar an Usage Credits für Mythos Preview bereit. Plus 4 Millionen Dollar an direkten Spenden an Open-Source-Security-Organisationen, darunter 2,5 Millionen an die Linux Foundation und 1,5 Millionen an die Apache Software Foundation.

Das Modell wird über die Claude API, Amazon Bedrock, Google Vertex AI und Microsoft Foundry verfügbar sein. Der Preis liegt bei 25 Dollar pro Million Input-Tokens und 125 Dollar pro Million Output-Tokens.

Warum Anthropic Mythos nicht öffentlich macht

Anthropic plant nicht, Claude Mythos Preview allgemein verfügbar zu machen. Der Grund ist offensichtlich: Ein Modell das Sicherheitslücken besser findet als fast jeder Mensch ist in den falschen Händen eine Waffe.

Anthropics CEO Dario Amodei sagt im Video klar: Stärkere Modelle werden kommen, von uns und von anderen. Wir brauchen einen Plan dafür. Deshalb arbeitet Anthropic an Safeguards die gefährliche Outputs erkennen und blockieren. Diese Schutzmaßnahmen sollen zuerst mit einem kommenden Claude Opus Modell getestet werden, bevor Mythos-Klasse-Modelle breiter zugänglich werden. Security-Profis können sich für ein kommendes Cyber Verification Program bewerben.

Was das für Unternehmen bedeutet

Ein Satz aus dem Video trifft es: «Everything that we do in our lives now depends on software. Software ate the world.» Jeder analoge Aspekt unseres Lebens ist mittlerweile digital abgebildet. Banking, Gesundheit, Logistik, Stromnetze. Die geschätzten globalen Kosten von Cyberkriminalität liegen bei rund 500 Milliarden Dollar pro Jahr.

Die Zeit zwischen dem Entdecken einer Schwachstelle und dem ersten Angriff schrumpft von Monaten auf Minuten. CrowdStrike-CTO Elia Zaitsev bringt es auf den Punkt — Angreifer werden dieselben Fähigkeiten nutzen, und das ist kein Grund langsamer zu werden, sondern schneller.

Für KMU heißt das konkret: Wer seine Software-Infrastruktur nicht regelmäßig auf Schwachstellen prüft, fährt jetzt mit offener Haustür. AI-gestützte Security-Scans werden kein Premium-Feature für Konzerne bleiben. Sie werden zur Grundausstattung.

Die Open-Source-Community profitiert am meisten. Jim Zemlin von der Linux Foundation sagt, dass Maintainer bisher Security allein stemmen mussten. Mit Mythos bekommen sie ein Werkzeug, das bisher nur großen Security-Teams vorbehalten war.

Meine Einschätzung

Project Glasswing ist das Wichtigste was Anthropic dieses Jahr veröffentlicht hat. Nicht wegen der Benchmarks, sondern wegen der Strategie dahinter.

Anthropic positioniert sich als das AI-Unternehmen das Sicherheit ernst nimmt — und gleichzeitig beweist, dass ihre Modelle die leistungsfähigsten auf dem Markt sind. Das ist kein Zufall. Claude Mythos Preview ist nicht nur ein Security-Tool. Es ist eine Demonstration, dass Anthropic bei Coding und Reasoning die Nase vorn hat.

Für mich zeigt das eine klare Richtung: AI-Modelle werden in den nächsten Monaten Aufgaben übernehmen, für die du heute noch ein Team aus Spezialisten brauchst. Security ist nur der Anfang. Wer jetzt nicht anfängt, AI-Tools in seine Workflows zu integrieren, wird den Anschluss verlieren.

Innerhalb von 90 Tagen will Anthropic öffentlich berichten, was Project Glasswing erreicht hat. Ich bin gespannt auf die Zahlen.

Du willst AI-Agenten und Security-Tools in dein Unternehmen integrieren? Lass uns reden.