Im Quellenvergleich
Worin die Quellen übereinstimmen
Anthropic veröffentlichte im Juni 2026 zwei neue KI-Modelle: Claude Fable 5 für die breite Öffentlichkeit und Claude Mythos 5 für ausgewählte Partner. Beide Modelle basieren laut Unternehmen auf derselben Technologie. Fable 5 enthält Sicherheitsvorkehrungen, die Anfragen zu sensiblen Themen wie Cybersicherheit, Biologie und Chemie an das schwächere Modell Claude Opus 4.8 weiterleiten. Die Preise liegen bei 10 Dollar pro Million Input-Tokens und 50 Dollar pro Million Output-Tokens. Zuvor hatte Anthropic in einem Blogartikel die zunehmende Automatisierung der eigenen Entwicklung durch das KI-Modell Claude beschrieben und vor den Risiken einer rekursiven Selbstverbesserung gewarnt. Die Quellen berichten weitgehend übereinstimmend über diese Fakten.
Worin sie sich unterscheiden
Häufigkeit der Auslösung von Sicherheitsfiltern- Die Sicherheitsfilter greifen in weniger als fünf Prozent aller Sitzungen ein.1
- Die Weiterleitung auf Opus 4.8 erfolgt in weniger als fünf Prozent der Sitzungen, bei Agenten-Benchmarks jedoch in 20,9 Prozent der Durchläufe.2
- Bei rund acht Prozent der Aufgaben leitet ein Fallback-Mechanismus die Anfrage an Opus 4.8 weiter.3
Erfolg von Jailbreak-Versuchen gegen Fable 5- In über 1.000 Stunden externer Tests mit Prämienprogrammen fand niemand einen universellen Weg, die Schutzfunktion zu umgehen.4
- Ein Sicherheitsforscher namens Pliny the Liberator knackte die Schutzmechanismen innerhalb von 48 Stunden nach der Veröffentlichung.5
- Das britische KI-Sicherheitsinstitut erzielte teilweise Fortschritte beim Umgehen der Schutzmechanismen.6
Leistungssprung von Fable 5 gegenüber Vorgängern- Der Leistungssprung zum Vorgänger Opus 4.8 beträgt gemessene 5,7 Prozent über viele Benchmarks hinweg.3
- Fable 5 übertrifft alle bisherigen Modelle des Unternehmens und dominiert fast alle Benchmarks.7
- Fable 5 erreicht auf dem SWE-Bench Pro eine Erfolgsrate von 80,3 Prozent, während Claude Opus 4.8 auf 69,2 Prozent kommt.8
Zugang zu Mythos 5- Mythos 5 ist nur für ausgewählte Cybersicherheitspartner im Rahmen von Project Glasswing zugänglich.9
- Mythos 5 erhalten Partner des Project-Glasswing-Konsortiums sowie ausgewählte Biologieforscher.9
- Mythos 5 wird in Zusammenarbeit mit der US-Regierung eingesetzt und steht rund 200 Partnerorganisationen zur Verfügung.10
Kosten für Fable 5 im Vergleich zu Vorgängern- Der Preis liegt bei 10 Dollar pro Million Input-Tokens und 50 Dollar pro Million Output-Tokens – weniger als die Hälfte des Mythos-Preises.4
- Der Preis liegt bei 10 Dollar pro Million Input-Tokens und 50 Dollar pro Million Output-Tokens – doppelt so viel wie Opus 4.8.11
Datenaufbewahrung bei Fable 5- Anthropic speichert den gesamten Datenverkehr für 30 Tage, um Missbrauch zu verhindern.12
- Anthropic speichert Prompts und Ausgaben bis zu 30 Tage, bei Regelverstößen bis zu zwei Jahre.3
- Die Daten dienen nur der Abwehr von Angriffen, nicht dem Training.11
Verdeckte Leistungsdrosselung- Anthropic hatte geplant, die Leistung des Modells für Nutzer, die damit konkurrierende KI-Modelle entwickeln, heimlich zu verschlechtern.13
- Nach scharfer Kritik entschuldigte sich Anthropic und machte die Schutzmaßnahmen sichtbar.3
- Anthropic setzt einen Mechanismus ein, der Antworten verschlechtert, wenn die KI beim Design von Infrastruktur für konkurrierende KI-Labore helfen soll.2
Einschränkung durch Microsoft- Microsoft schränkt den internen Einsatz von Fable 5 ein, weil das Modell verlangt, dass Eingaben und Antworten bis zu 30 Tage gespeichert werden.14
- Fable 5 fehlt in der internen Modellauswahl der GitHub-Copilot-Version, während alle anderen Claude-Modelle unter Zero-Data-Retention-Regeln laufen.15
Kritik an Sicherheitsfiltern durch Fachleute- Sicherheitsforscher kritisieren, dass die Filter auch bei harmlosen Anfragen wie Code-Review oder dem Lesen eines Blogbeitrags zu Sicherheitsthemen auslösen.16
- Ein medizinischer Physiker berichtet, das Modell sei für ihn unbrauchbar, weil er das Wort 'nuclear' häufig verwende.3
- Die Schutzmechanismen wirkten schlagwortbasiert: Selbst die Aufforderung, sicheren Code zu schreiben, löse die Schutzmechanismen aus.17
Zeitpunkt der Veröffentlichung nach Warnung- Der Zeitpunkt der Forderung kurz vor Anthropics vertraulichem Börsengang irritiert.18
- Anthropic veröffentlichte sieben Tage nach einer öffentlichen Warnung vor den Gefahren von KI die neue Modellklasse Mythos.2
Leistung im Mathematik-Benchmark FrontierMath- Fable 5 erreicht im Mathematik-Benchmark FrontierMath eine Genauigkeit von 87 Prozent auf den Stufen 1 bis 3 und 88 Prozent auf der schwierigsten Stufe 4.19
- Das Vorgängermodell Opus 4.5 lag Anfang 2026 auf Tier 4 noch unter 10 Prozent.19
Einsatz von Anthropic-Ingenieuren beim US-Geheimdienst NSA- Die Financial Times berichtet, dass Anthropic Ingenieure beim US-Geheimdienst NSA für offensive Cyberoperationen eingesetzt hat.20
- Steven Murdoch von University College London sieht darin keinen Widerspruch: Anthropics Definition von KI-Sicherheit sei eng.20
Leistung von Mythos 5 in der Biologie- Mythos 5 habe Aspekte des Medikamentendesigns um das Zehnfache beschleunigt und in der Genomik über eine Woche weitgehend autonom gearbeitet.8
- In einer internen Medikamentenstudie lieferte das Modell bei 9 von 14 Proteinzielen vielversprechende Kandidaten – diese Ergebnisse sind nicht peer-reviewed.21
Fähigkeit von Mythos 5 zur Waffenherstellung- Die KI erreiche die Fähigkeitsstufe CB-1 (Hilfe bei der Herstellung bekannter biologischer oder chemischer Waffen), aber nicht CB-2 (Erschaffung neuartiger Waffen auf dem Niveau von Weltexperten).2
- Anthropic sorgt sich besonders um die Fähigkeit von Mythos 5 zum 'agentischen Hacken'.22
Verfügbarkeit von Fable 5 in Abo-Plänen nach dem 22. Juni- Bis zum 22. Juni ist Fable 5 in Pro-, Max-, Team- und Enterprise-Plänen kostenlos enthalten. Danach verlangt Anthropic Nutzungsguthaben.11
- Abonnenten können Fable 5 14 Tage testen, verbrauchen dabei aber die doppelte Menge ihres Nutzungsrahmens. Ab 23. Juni wird es ausschließlich nach Tokenmenge abgerechnet.18
Anthropics Haltung zur globalen Entwicklungspause- Anthropic plädiert für die Möglichkeit, die Entwicklung vor der rekursiven Selbstverbesserung zu verlangsamen oder zu pausieren.23
- Anthropic wäre bereit, selbst zu bremsen, wenn andere Entwickler dies nachweislich ebenfalls täten.23
- Eine einseitige Pause eines einzelnen Labors reiche nicht aus, da sie nur ändere, wer vorn liegt.24