https://aitoolanalysis.com/claude-code/
Claude Opus 4.5 is the first AI model to break 80% accuracy on SWE-bench Verified, which tests real-world GitHub bug fixing. This isn’t a marginal improvement—it’s a clear 3-5 percentage point lead over every competitor. Opus 4.5 scored higher on Anthropic’s internal engineering exam than any human candidate ever has. Let that sink in.
Hinweis: Eine Information in diesem Artikel ist mittlerweile überholt, inzwischen kann man auch mit dem Standard-Abonnement für 20 US$ im Monat Opus 4.5 verwenden. Oder man nutzt einen API-Key, das ging seit Veröffentlichung und ist für viele Anwendungsfälle ohnehin günstiger, und damit kann man auch Opus 4.5 leicht in z.B. den Cursor AI Editor oder in Chatbox AI integrieren.
Es wäre jedenfalls sehr zu empfehlen, das neue Modell zu aktivieren, denn das ist kein kleines Update, sondern ein Paradigmenwechsel.
Opus 4.5 hat auf dem SWE-bench Verified (dem Goldstandard für autonome Software-Entwicklung) Rekorde gebrochen. Wir sprechen hier von einer Fähigkeit, GitHub-Issues nicht nur zu verstehen, sondern autonom zu lösen, die weit über das hinausgeht, was wir noch Anfang 2025 gesehen haben. Man kann Opus 4.5 in eine IDE integrieren (via Cursor oder Windsurf Updates) und ihm komplexe Refactoring-Aufgaben geben, wie: „Aktualisiere die API-Endpunkte in Modul X und pass alle Tests in Modul Y an.“ Und es funktioniert tatsächlich. Das große Kontextfenster bedeutet zudem, dass das Modell riesige Codebases „im Kopf“ behalten kann, ohne zu halluzinieren.
Anthropic (die Schöpfer von Claude) haben sich von Anfang an auf KI für Programmierer spezialisiert, und die Problemlösungsfähigkeiten von Opus sind tatsächlich sensationell. Ein Riesenschritt voran für die SW-Entwicklung.
Außerdem hat Google ungefähr zeitgleich Gemini 3 Pro vorgestellt, dessen Fokus aber mehr all-purpose ist. Auch dieses Modell ist sensationell gut und hat für weltweite Furore gesorgt, der Kurs von Alphabet (Google-Mutter) sprang steil nach oben und steigt weiter. Im Coding muss Gemini 3 Pro sich zwar Opus 4.5 geschlagen geben, aber in vielen anderen Themenbereichen liegt es dennoch klar vorn.
Gleich zwei neue Spitzenmodelle mit enormen Fortschritten, nahezu zur gleichen Zeit – wirklich überraschend, wo es doch noch vor kurzem hieß, gravierende Fortschritte bei KI seien erstmal nicht mehr zu erwarten. Bei OpenAI brennt jedenfalls die Hütte, Sam Altman hat einen „Code Red“ ausgerufen und viele Aktivitäten gestoppt, um mit ChatGPT wieder Boden gut zu machen.

