Der Stammvater schlägt zurück

https://cursor.com/de/blog/composer-2-5

Vor nicht allzu langer Zeit war Cursor so etwas wie die unbestrittene Referenz im Bereich KI-gestützter Entwicklungsumgebungen. Der KI-Editor hatte einen Vorsprung, den die Konkurrenz erst mal aufholen musste – aber das ist ihr in beeindruckendem Tempo gelungen. GitHub Copilot, Windsurf, Zed, Cline, Goose, Codex, Claude Code, opencode und eine wachsende Zahl weiterer Tools haben den Markt in kurzer Zeit massiv belebt. Der Druck auf Cursor ist real. Mit Composer 2.5 gibt Cursor jetzt eine klare Antwort – und sie hat zwei Dimensionen, die es wert sind, näher betrachtet zu werden.

Preiskampf als strategische Entscheidung

Die vielleicht wichtigste Zahl im gesamten Announcement: 0,50 US-Dollar pro Million Input-Token, 2,50 Dollar pro Million Output-Token. Das ist der Standardpreis für Composer 2.5 – ein Modell, das in Benchmarks auf Augenhöhe mit den aktuellen Frontier-Modellen von Anthropic und OpenAI liegt.

Zum Vergleich: Claude Opus 4.7 von Anthropic kostet derzeit 5 Dollar pro Million Input-Token und 25 Dollar pro Million Output-Token im Standard-Tier (Fast-Tier nochmal deutlich darüber). GPT-5.5 bewegt sich in ähnlichen Regionen. Cursor bietet mit Composer 2.5 also Frontier-Qualität zu einem Bruchteil des Preises.

Auch die schnellere Variante – der standardmäßig aktive Modus – ist mit nur 3 Dollar Input und 15 Dollar Output kalkuliert. Cursor betont, dass auch das weit unter den Fast-Tier-Preisen der anderen Frontier-Modelle liegt, bei gleicher Intelligenz.

Das ist kein Zufall. Hier wird gezielt dort angegriffen, wo Wettbewerber am verwundbarsten sind: bei den Betriebskosten für Teams und Unternehmen, die Coding-Agenten in nennenswertem Umfang einsetzen.

Warum das möglich ist: Open Source macht den Unterschied

Und damit zum zweiten und aus unserer Perspektive eigentlich spannenderen Punkt.

Composer 2.5 basiert auf Kimi K2.5, einem Open-Source-Modell des chinesischen KI-Unternehmens Moonshot AI. Das Basismodell ist frei verfügbar – jeder kann es herunterladen, studieren, verändern und für eigene Zwecke weiterentwickeln. Genau das hat Cursor getan.

Das Team hat Kimi K2.5 als Ausgangspunkt genommen und es mit einem umfangreichen, hochspezialisierten Training auf Coding-Aufgaben optimiert. Cursor hat dabei seine großen Stärken genutzt, nämlich lange Erfahrung mit Coding-Tasks sowie umfangreiche eigene Trainingsdaten aus realem Nutzerverhalten. Das Ergebnis: ein Modell, das in seiner Domäne mit den teuersten proprietären Systemen mithalten kann – aber zu einem Preis, den diese sich strukturell nicht leisten können oder wollen.

Das ist das Open-Source-Prinzip in seiner reinsten Form. Nicht jedes Unternehmen muss ein Foundational Model von Grund auf neu trainieren. Wer weiß, was er braucht – und Cursor weiß sehr genau, was gute Coding-Agenten brauchen –, der kann auf einer soliden öffentlichen Basis aufbauen und gezielt optimieren. Die Ressourcen fließen dann nicht in das Nachbauen von allgemeiner Intelligenz, sondern in das Verfeinern für konkrete Anforderungen.

Dieses Muster ist es, das Open Source so mächtig macht: Es demokratisiert nicht nur die Nutzung von KI, sondern auch deren Weiterentwicklung. Eine Firma, ein Team oder im Extremfall auch eine Einzelperson kann ein bestehendes Modell nehmen und daraus etwas Besseres machen – für einen bestimmten Use Case, eine bestimmte Sprache, eine bestimmte Branche.

Was technisch hinter Composer 2.5 steckt

Cursor hat beim Training einiges investiert. Zwei Ansätze stechen heraus:

Targeted RL with Textual Feedback – ein elegantes Verfahren, das eines der klassischen Probleme von Reinforcement Learning adressiert: Wenn ein Modell über hunderttausende Token hinweg eine Aufgabe bearbeitet und dabei einen einzelnen Fehler macht, ist das finale Reward-Signal zu unscharf, um gezielt darauf zu trainieren. Cursor löst das, indem an der genauen Stelle, wo ein Fehler passiert ist, ein lokaler Hinweis eingefügt wird – und das Modell über einen Distillationsprozess genau dort optimiert wird, nicht über den gesamten Rollout.

Synthetische Trainingsdaten im 25-fachen Umfang gegenüber Composer 2. Das Training braucht immer schwierigere Aufgaben, um weiter zu lernen – Cursor generiert sie dynamisch, unter anderem durch ein sogenanntes Feature-Deletion-Verfahren: Ein Modell bekommt eine funktionierende Codebase, soll gezielt Features entfernen und diese dann selbstständig reimplementieren. Die Tests fungieren als verifizierbares Reward-Signal.

Dass das Modell dabei zunehmend kreativ wurde – einmal hat es einen Python-Type-Checking-Cache reverse-engineered, ein anderes Mal Java-Bytecode dekompiliert –, zeigt sowohl die gewachsene Fähigkeit als auch die Komplexität, die modernes RL-Training mit sich bringt.

Ein Ausblick, der aufhorchen lässt

In Kooperation mit SpaceXAI trainiert Cursor aktuell ein deutlich größeres Modell von Grund auf – mit 10-facher Compute-Menge auf Basis von Colossus 2 und einer Million H100-Äquivalenten. Composer 2.5 ist also nicht das Ziel, sondern eine Zwischenstation auf dem Weg zu etwas noch Größerem.

Wer Cursor in den letzten Monaten etwas aus den Augen verloren hat – verständlich, der Markt ist voll –, sollte es vielleicht wieder auf dem Radar haben. Das Unternehmen hat verstanden, dass in einem gesättigten Markt Preis und spezialisierte Qualität die entscheiden­den Hebel sind. Und es hat mit Open Source genau das Werkzeug genutzt, das beides gleichzeitig ermöglicht.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert