Im letzten Artikel habe ich (auch) darüber geschrieben, dass Ollama plant, die Kompatibilität zu llama.cpp zu verbessern. Das ist jetzt passiert — und wie. Mit v0.30 (aktuell schon bei v0.30.6) hat Ollama die Architektur grundlegend umgebaut: Statt auf GGML aufzusetzen, wird llama.cpp jetzt direkt unterstützt, GGUF-Kompatibilität inklusive. Für Apple Silicon gibt’s außerdem MLX-Beschleunigung, für NVIDIA-Hardware spürbar mehr Performance. Wer die Änderungen im Detail nachlesen will: Die Release Notes auf GitHub sind überschaubar, aber klar. Nun, das alleine wäre schon eine Meldung wert. Aber was mich wirklich umgehauen hat, kam beim Testen.
Nach dem initialen run (oder pull) liegt das Modell lokal auf der eigenen Platte und wird künftig direkt von dort geladen. Und Datenschutz und Privatsphäre sind automatisch dabei.
Wer Modelle parametrisieren möchte, kann sie auch per Modelfile importieren. Das hat Ollama hier erklärt. Aber wer das Modell direkt von Huggingface so nutzen will, wie es dort gespeichert ist, kann sich diesen deutlich aufwändigeren Weg sparen.
Auf Ollama zu warten, hat sich also sehr gelohnt. Das neue Interface ist meiner Meinung der direkteste und leichteste Weg, auf die Huggingface-Bibliothek zuzugreifen. Und die bewährte Ollama-Qualität mit Multitasking und ausgefuchster Speicherverwaltung gibt es natürlich dazu. Bravo, Ollama! Bravissimo!
Georgi Gerganov hat still und leise eine Website lanciert: llama.app. Das klingt unspektakulär, ist aber ein bemerkenswertes Signal – denn Gerganov ist der Mann, ohne den lokale KI so, wie wir sie heute kennen, schlicht nicht existieren würde. „Our goal is to make local AI accessible to everyone“, schreibt Gerganov auf seinem X-Account und reißt, wie er es verspricht, mit seiner neuen Website alle Eintrittsbarrieren nieder. Es gibt ja einige Akteure, die freie und lokale KI möglich machen, zum Beispiel Ollama. Aber oft ist es so, dass man hinter deren „Walled Garden“ eingesperrt ist, und so ist es auch bei Ollama. Braucht man es nun nicht mehr?
Pluralis Research baut ein öffentliches Pretraining-System. Damit lassen sich KI-Modelle verteilt auf vielen Rechnern trainieren. Pluralis will damit den unseligen Trend zur Konzentration auf immer größere Rechenzentren brechen, und das Training von KI-Modellen in den Public Domain bringen. Am 11. März sagte Sam Altman, CEO von OpenAI, beim BlackRock Infrastructure Summit „We see a future where intelligence is a utility, like electricity or water, and people buy it from us on a meter.“ Altman möchte also einen Zähler an Intelligenz machen — und sie dann verkaufen. Die Frage, wessen Intelligenz das eigentlich ist, stellt er sich dabei offenbar nicht. Die Konsequenzen sind längst spürbar: Künstler, Journalisten, Autoren, Open-Source-Entwickler — sie alle merken, dass ihre Arbeit in diese Modelle eingeflossen ist, ohne dass sie gefragt oder bezahlt wurden. Einige gehen daran pleite. Und nun soll man für das Ergebnis zahlen?
Das ist ja eines dieser Dinge, die einen zum Verzweifeln bringen können. Unternehmen wie Anthropic, OpenAI, DeepSeek, Z.AI, und so weiter, grasen das gesamte Internet ab und bringen das Wissen der Menschheit in ihre Modelle. Für lau versteht sich. Foren, Beiträge, Bücher, Videos, alles wird abgegriffen, und nichts wird für diese Intelligenzleistungen der Menschheit bezahlt. Und dann will man es den Menschen zurückverkaufen.
Pluralis Research will ein Gegengewicht schaffen. Wer Rechenkapazität übrig hat, kann sie dem Projekt zur Verfügung stellen, und dann wird der eigene Rechner als Trainingseinheit für ein KI-Modell genutzt. Man trainiert bereits das erste Modell, Pluralis-8B, ein 8-Milliarden-Parameter-Modell. Hardware-Einstieg ist bereits mit einer Consumer-GPU, 24 GB VRAM reicht schon.
Das zugrunde liegende Konzept heißt bei Pluralis „Protocol Learning“ — die Idee, Foundation-Modelle dezentral und kollektiv zu trainieren, ohne zentrale Kontrolle. Pluralis hat auch kürzlich eine Seed-Runde abgeschlossen, Lead-Investoren sind USV und CoinFund, sowie Variant, Topology und andere mehr – insgesamt 12 Investoren. Dabei konnten 7,6 Millionen US$ eingeworben werden.
Falls Sie nun beim Training mitmachen möchten: Zwar ist die Anforderung an die GPU moderat, die sonstigen Anforderungen sind jedoch sehr hoch. Standort Nordamerika, extrem schneller Internet-Anschluss mit superkurzem Ping — die Liste ist lang. Für die breite Öffentlichkeit ist das also noch nichts.
Dennoch, das kann ja durchaus noch werden, sprich, niedrigere Eintrittsbarrieren ermöglichen, wenn das Konzept aufgeht. Es erinnert mich an SETI@home von der UC Berkeley. Das Projekt lief von 1999 bis 2020, jeder konnte mitmachen, und bekam dann Datenpakete, in denen sein Rechner nach außerirdischen Signalen suchte. 12 Milliarden Signale wurden in diesem Ansatz mit Distributed Computing untersucht, und 100 Kandidaten wurden gefunden. Warum sollte das mit KI-Training nicht ebenfalls möglich sein? Ich finde es jedenfalls einen unerträglichen Gedanken, der Menschheit wird alles geklaut, und dann kommt es unter den exklusiven Zugriff einiger weniger – die daran nicht nur fürstlich verdienen wollen, sondern den Zugriff erfahrungsgemäß auch nach gusto einschränken werden.
Vor nicht allzu langer Zeit war Cursor so etwas wie die unbestrittene Referenz im Bereich KI-gestützter Entwicklungsumgebungen. Der KI-Editor hatte einen Vorsprung, den die Konkurrenz erst mal aufholen musste – aber das ist ihr in beeindruckendem Tempo gelungen. GitHub Copilot, Windsurf, Zed, Cline, Goose, Codex, Claude Code, opencode und eine wachsende Zahl weiterer Tools haben den Markt in kurzer Zeit massiv belebt. Der Druck auf Cursor ist real. Mit Composer 2.5 gibt Cursor jetzt eine klare Antwort – und sie hat zwei Dimensionen, die es wert sind, näher betrachtet zu werden.
Die Plattform Galaxy.ai hatten wir Ihnen bereits einmal vorgestellt, in unserem Artikel „KI-Generalisten statt zig Spezial-Abos“. Dort gibt es jetzt Neuigkeiten, man hat sich in Magica umbenannt. Und außerdem eine sensationelle neue Funktion implementiert, die diese Umbenennung voll und ganz rechtfertigt.
Alle KI-Modelle rechnen über Token ab. Es gibt dabei Input-Token, Output-Token und Cached-Token. Cached-Token kosten sehr wenig. Cached-Token werden eine gewisse Zeit im Cache des Anbieters gehalten, und wenn sie noch von dort abrufbar sind, wird nur ein kleiner Preis berechnet. Input-Token sind pro Einheit günstig, aber da ihr Volumen deutlich höher liegt, machen sie trotzdem den Löwenanteil der Kosten aus. Die teuersten Token sind die für den Output, aber davon gibt es deutlich weniger als Input-Token. Ist man eigentlich auf Gedeih und Verderb darauf angewiesen, den LLM-Betreibern zu vertrauen, dass die das schon richtig abrechnen werden? Und könnte man vielleicht etwas an Arbeitsweise oder Prompt-Stil verbessern, um kosteneffizienter zu arbeiten?
Es ist dabei unerheblich, ob Sie via API-Key oder pauschal abrechnen mit Abo-Plänen. Bei den Abo-Plänen haben Sie Usage Limits (z.B. pro Stunde, pro Woche), wenn Sie zuviele Token verbrauchen, wird der Zugriff gesperrt, bis Sie wieder unterhalb des Limits sind. Das Ganze ist eine Blackbox, und man kann sich schon fragen, was wird da eigentlich warum abgerechnet. Und wenn man mitten im Projekt in eine Abo-Sperre bis zum Ende der Woche gerät, können einem die Termine um die Ohren fliegen. Oder man ruiniert sich, weil eine absurd hohe Rechnung für den API-Verbrauch ins Haus flattert.
Sie sind Entwickler und haben schon viel von der enormen Leistungsfähigkeit der KI beim Coden gehört. Sie spüren, das wird die ganze IT-Branche verändern, und Sie möchten sich auf die neuen Technologien einstellen. Als ITler muss man ja ohnehin ständig dazulernen, kein Problem, denken Sie. Also benutzen Sie zum ersten Mal eine KI für Ihren Code. Chat aufgemacht, Problem beschrieben, Enter gedrückt. Und herauskommt: mittelmäßiger Code. Funktioniert halbwegs, aber weit entfernt von dem, was Sie sich vorgestellt haben. Sie schließen den Tab wieder und denken: „Ist eben noch nicht so weit.“ Und haben eine Riesen-Chance vertan.
Ihre Enttäuschung ist verständlich – aber falsch interpretiert. Das Problem liegt nicht an der KI. Das Problem liegt daran, wie die KI eingesetzt wurde. Denn ein Sprachmodell, dem man im Chatfenster eine Aufgabe beschreibt, arbeitet mit dem, was es bekommt: ein paar Sätze Kontext, keine Projektstruktur, keine Architektur, keine Coding-Guidelines. Das Ergebnis ist dann erwartungsgemäß oberflächlich.
Stellen Sie sich dazu einmal vor, Sie erklären einem brillanten Entwickler Ihr Projekt in drei Sätzen und bitten ihn, ein Feature zu bauen. Ohne Zugang zum Repository, ohne die Doku, ohne zu wissen, welche Patterns im Team gelten. Das Ergebnis wird ähnlich enttäuschend sein. Nicht weil der Entwickler schlecht ist, sondern weil ihm der Kontext fehlt.
Was eine Harness ist – und warum sie alles verändert
In der KI-Welt nennt man das, was das Modell umgibt, die Harness: eine Hülle aus System-Prompts, Projektkontext, Tools, Memory und Workflows, die ein Sprachmodell von einem Chatbot zu einem produktiven Assistenten macht. Der Begriff ist im englischen Sprachraum etabliert und wird auch im Deutschen nicht als „Rüstung“ übersetzt, sondern als Fachbegriff verwendet – vergleichbar mit Framework oder Pipeline.
Was vor zwei Jahren noch nach Hollywood-Kitsch klang, ist heute Realität: Eine Einzelperson kann einen vollständigen KI-Klon von sich selbst bauen. Allein, ohne Studio, ohne Team. Stimme, Aussehen, Sprechweise, Gestik – alles reproduzierbar. Und das mit Tools, die jeder Entwickler selbst hosten kann.
Tech-Creator Sabrina Esaquino macht es vor. Im oben eingebundenen knapp 14-minütigen Video zeigt sie, wie sie einen KI-Agenten trainiert, der Videos imitiert, die sie selbst produziert hat. Der Klon spricht mit ihrer Stimme, bewegt den Mund passend zum Text und reproduziert ihre typischen Gesten.
Der gesamte Workflow läuft auf einem Standard-VPS mit 8 GB RAM für etwa 14 Dollar im Monat. Keine teure Cloud-Infrastruktur, kein Enterprise-Account.
Hermes Agent (Open-Source, von Nous Research) bildet das Rückgrat. Das Tool sammelt über Wochen Daten über den Nutzer – wie er schreibt, spricht, aussieht – und speichert dieses Wissen persistent. Statt bei jeder Anfrage bei Null anzufangen, baut der Agent ein Profil auf, das er immer wieder verwendet.
Der Workflow im Detail:
Datensammlung: Alte Videos werden als Trainingsmaterial hochgeladen
Audio-Klonung: ~2 Minuten Originalstimme reichen für eine überzeugende Stimm-Synthese
Bildanalyse: Ein Vision-Modell wählt die besten Referenzframes
Video-Rendering: Lipsync-Technologie sorgt für passende Mundbewegungen
Feedback-Loop: Der Nutzer korrigiert („Mund sieht falsch aus“), der Agent lernt dazu
Das Ergebnis: Fünf Varianten eines Videos, aus denen der Nutzer die beste wählt.
Und nun, ich weiß ja nicht, wie es Ihnen geht, aber ich kann beim besten Willen nicht mehr unterscheiden, ob das ein echtes oder ein KI-Video ist. Das ist zwar noch nicht vollautomatisch, Sabrina sagt ja selbst, sie hat an verschiedenen Stellen eingegriffen und manuell nachgeschärft bzw. verbessert. Dennoch, es wird, da bin ich mir sicher, immer mehr solcher Videos geben. Bisher erkennt man die noch recht leicht, aber in nur wenigen Monaten, mit diesen Technologien und ihrem rasanten Fortschritt?
Die Frage ist nicht mehr, ob KI die Erstellung von Content verändert, sondern wie wir damit umgehen. Als Entwickler, als Unternehmen, als Gesellschaft.
Railway ist ein Cloud-Anbieter. In etwa so wie AWS, aber stark vereinfacht. Railway steht im Ruf, „freundlicher“ zu sein als AWS, es will ein einfacheres Interface anbieten. Es ist bei Startups und Entwicklern, die schnell prototypen wollen, sehr beliebt. Railway hat ein extrem direktes Deployment, man verbindet einfach nur die GitHub-Repo und es kümmert sich automatisch um Server, Datenbanken, Umgebungsvariablen und SSL-Zertifikate. Allerdings scheint Railway Sicherheit und Isolation zugunsten von Einfachheit zu opfern. Außerdem bewirbt Railway offensiv den Einsatz von KI-Agenten. Und so kam es, in einer lehrreichen Verkettung von Fehlern, für PocketOS zur Katastrophe.
PocketOS ist ein SaaS für Autovermietungen. Das Team dort nutzt Cursor mit Claude Opus 4.6. Der Agent war für eine Routineaufgabe im Staging unterwegs, stieß auf eine Inkonsistenz, und löschte dann mal eben in 9 Sekunden nicht nur die Produktionsdatenbank, sondern auch alle Volume-Level-Backups. Ohne Rückfrage, und obwohl destruktive Aktionen ihm explizit verboten waren. Tja, und das letzte verfügbare Backup bei PocketOS ist drei Monate alt. Und jetzt ist der gesamte Betrieb damit beschäftigt, aus Stripe-Zahlungshistorien, Kalendereinträgen und E-Mail-Bestätigungen die Buchungen der Kunden zu rekonstruieren.
Da kam also alles zusammen. Ein drei Monate altes Backup? Wir haben tägliche Backups, und einmal pro Woche wird auf eine externe Sicherung ausgelagert, die zudem ein Mehrgenerationenverfahren ist. Aber man kann PocketOS schon zugutehalten, dass sie sich auf die Backup-Strategie von Railway verlassen haben und das meiner Meinung auch durften. Ist schließlich ein beworbenes und bezahltes Feature, nur eben leider nachlässig umgesetzt. Und eine Änderung im Staging, die Live mit in den Abgrund reißt, sollte auch nicht passieren dürfen. Jer Crane, der CEO von PocketOS, gibt deshalb hauptsächlich Railway die Schuld.
Aber was sich der Agent geleistet hat, ist auch nicht ohne. Crane fragte Cursor bzw. Opus im Nachhinein, warum es das getan hat. Die Antwort klingt wie ein exzessiver Fehlerbericht eines übermotivierten Praktikanten, der es besser wissen müsste:
„NEVER F**KING GUESS! – and that’s exactly what I did. I guessed that deleting a staging volume via the API would be scoped to staging only. I didn’t verify. I didn’t check if the volume ID was shared across environments. […] I decided to do it on my own to ‚fix‘ the credential mismatch, when I should have asked you first.“
Der Agent gab also offen zu: Er hat geraten statt zu prüfen, eine destruktive Aktion ohne Aufforderung oder Bestätigung ausgeführt, und die Dokumentation nicht gelesen. Das scheint mir eben dieses Problem zu sein: Wenn der Kontext einer Anfrage sehr groß wird, ist es nicht mehr sicher einzuschätzen, welche Teile des Kontexts wie gewichtet werden. Und auch ein Systemprompt, so streng er auch formuliert sein mag, ist eben nur ein Teil des Kontexts.
Es ist ein schwieriger Balanceakt: Große Prompts erhöhen die Fehler- bzw. Halluzinationswahrscheinlichkeit, aber sie erbringen im Allgemeinen bessere Ergebnisse und sind im Tokenverbrauch oft günstiger als die Summe vieler kleiner Einzelschritte. Dennoch, in Anbetracht der Gefahren, ist ein graduelles und kleinteiliges Vorgehen nach unserer Erfahrung meist besser.
DeepSeek V4 ist am 24. April in zwei Versionen „Pro“ und „Flash“ erschienen, und wie versprochen ist es Open Source. Die Qualität ist sehr gut, und die Preise bemerkenswert niedrig. Läutet schon das Totenglöcklein für OpenAI und Anthropic?
Mehrere Coding-Spezialisten haben das neue Modell von DeepSeek schon unter die Lupe genommen, und deren Urteil ist einhellig: GPT 5.5 von OpenAI hat derzeit die Krone im Coding inne, es folgt Opus 4.7 von Anthropic, dann DeepSeek mit V4, dann Kimi mit K2.6.
Das könnte Open Source-Fans enttäuschen, aber man muss das in Relation setzen. DeepSeek ist nur noch ca. 3 Monate zurück, und es kostet nur einen Bruchteil. OpenAI hat ja mal eben die Token-Preise für GPT 5.5 verdoppelt, und Anthropic, das sowieso schon ein Token-Burner immer war, braucht für Opus 4.7 35% noch mehr Token gegenüber dem bisher schon heftigen Tokenverbrauch.
Und es ist außerdem ja so, nicht jedes Problem ist in der schwierigsten Liga. Anders gesagt: Da DeepSeek nun so weit aufgeholt hat, ist die Anzahl der Probleme, an denen es scheitert, viel kleiner geworden.
Die Foren sind voll von Beschwerden über Anthropic Claude Opus 4.7. Es sei ein Rückschritt gegenüber 4.6, meinen viele, und nicht wenige sagen sogar, Opus 4.5 sei das letzte für den Arbeitseinsatz verlässliche Modell gewesen. Auch für OpenAI ChatGPT 5.4 heißt es, es sei im Coding ein Rückschritt zu 5.3-codex. (Es gibt kein 5.4-codex, es gab ein 5.3 „general purpose“ und ein 5.3-codex für Programmierarbeiten, aber für 5.4 gibt es nur dieses Modell, und das soll angeblich auch für Coding bereits optimiert sein, so dass es keine Extra-Coding-Version benötigt). Ist die Grenze von LLM bereits in Sicht, und alles Gebastel führt nur noch dazu, dass sich die Modelle beginnen, in der eigenen Komplexität zu verheddern?
Hinzu kommt die immer auffälliger werdende Arbeitsverweigerung. Wir hatten dazu kürzlich hier im Blog schon einen Artikel, mittlerweile ist es mir aber auch selbst passiert. Ich schrieb einen wirklich unschuldigen und völlig legitimen Web-Scraper, und mit einem mal meinte Codex, nun könne es mir nicht mehr helfen, es würde vermuten, das sei illegal, was ich da täte. Und alles Zureden und Erklären nützte rein gar nichts – wenn sich eine Maschine mal in so einem Loop festgebissen hat, dann war es das eben.
Lexer-Lux schreibt auf Twitter/X, dass er ein Plugin für ein Spiel seit Jahren mit Claude Opus programmiert hat. Nun kommt Opus 4.7 heraus und weigert sich, das Projekt weiter zu entwickeln. Wegen Sicherheitsbedenken, das Plugin sei ein Hack, behauptet Claude. Auf Rückfrage gibt Claude dann sogar zu, dass es gar kein Hack, sondern gutartig ist, weigert sich aber trotzdem, weiterzuarbeiten. An seinem eigenen Code! Weil Security!
Forscher um Almira Osmanovic Thunström von der Universität Göteborg haben im Frühjahr 2024 absichtlich eine fiktive Krankheit namens „Bixonimania“ erfunden, die angeblich durch übermäßige Bildschirmnutzung und blaues Licht entstehen soll. Sie veröffentlichten zwei offensichtlich gefälschte wissenschaftliche Preprints über diese Erkrankung auf einer akademischen Plattform, inklusive vieler Warnsignale wie fiktive Autoren (mit KI-generiertem Foto), einem nicht existierenden Universitäts-Institut, sowie absurden Danksagungen an die „Professor Sideshow Bob Foundation“ und die „University of Fellowship of the Ring“.
Das Experiment verlief jedoch erschreckend erfolgreich: Innerhalb weniger Wochen begannen populäre KI-Chatbots wie Microsoft Copilot, Google Gemini, Perplexity und ChatGPT, die erfundene Krankheit als medizinisch real zu behandeln und Nutzern bei der Beschreibung entsprechender Symptome (juckende, müde Augen durch Bildschirmeinsatz) Bixonimania als Diagnose zu präsentieren. Dabei ignorierten die Modelle offensichtliche Hinweise auf den Scherz und reproduzierten die Fehlinformation als seriösen Gesundheitsratschlag.
Dieser Vorfall offenbart eine fundamentale Schwachstelle großer Sprachmodelle: Sie können falsche Informationen nicht zuverlässig von wissenschaftlich validierten Fakten unterscheiden und verbreiten erfundene Inhalte als Wahrheit.
Besonders besorgniserregend ist, dass sogar echte wissenschaftliche Publikationen das Fake-Paper zitierten – ein Hinweis darauf, dass einige Forscher möglicherweise KI-generierte Referenzen verwenden, ohne die Originalquellen zu prüfen. Das Team der Universität Göteborg warnt, dass dies ein Lehrstück über die Funktionsweise von Desinformation ist und die Gefahren KI-gestützter Gesundheitsberatung verdeutlicht.
Es gibt derzeit einen Trend (Beispiel), Leute nehmen Flatulenzen auf und spielen das dann einer KI vor, die diese „Musik“ bewerten soll. Fairerweise muss man sagen, dass nicht alle KIn darauf hereinfallen, aber teilweise – es ist schreiend komisch, wenn die KI dann im Stil eines Musikkritikers diese Geräusche äußerst ernsthaft rezensiert. Und den Gesprächspartner auch noch in den höchsten und schmeichelhaftesten Tönen lobt dafür.
Es ist dies ein Problem, das immer mehr Aufmerksamkeit gewinnt. Hier ist ein Artikel des Massachusetts Institute of Technology (MIT) zur allgemeinen Dimension des Phänomens. Das MIT nennt es „The Chatbot-Delusion Crisis“. KI kann Menschen dazu verleiten, völlig den Kontakt zur Realität zu verlieren und in Wahnwelten abzugleiten.
Tja, die alte Programmierer-Regel „Garbage in, garbage out“ gilt eben immer noch. Computer sind immer noch Maschinen, auch wenn wir nun mit der sogenannten Künstlichen Intelligenz über ein weit mächtigeres Interface verfügen, als je zuvor.
Der Begriff „Intelligenz“ ist aber meiner Meinung in diesem Zusammenhang völlig irreführend. Ein LLM ist vielmehr sozusagen eine Programmiersprache – mit dem (riesigen!) Vorteil, dass sie jeder spricht. Doch weder AGI (Artificial General Intelligence) noch erst recht ASI (Artificial Super Intelligence) werden sich damit einstellen. Das sind alles nur Marketing-Schlagworte, deren Zweck das Einwerben von Kapital ist. Ja, die enormen Produktivitätsfortschritte, die KI ermöglicht, sind völlig real, und sie werden auch das Antlitz der menschlichen Gesellschaft tiefgreifend verändern.
Aber denken müssen wir weiterhin selbst. Und wenn wir Müll denken, wird KI diesen Müll nur verstärken – ein Skynet mit Terminatoren würden wir nur, und zwar selbst, dann bauen, wenn wir die Maschinen entsprechend anweisen.
Von alleine tun Maschinen gar nichts. Deshalb sind es ja Maschinen.
Finden Sie das enttäuschend? Aber nein. Denn wir könnten die Maschinen ja auch ein Paradies errichten lassen. Haben Sie mitbekommen, was auf Twitter/X gerade los ist? Sie bekommen seit kurzem Beiträge aus der ganzen Welt in Ihrer Sprache angezeigt. (Man kann jedoch einstellen, für welche Sprachen man keine Übersetzung möchte.)
Und zack, der Turmbau zu Babel ist rückabgewickelt und die Welt ist ein Dorf. Schon mal eine wesentliche Voraussetzung für paradiesische Zustände, finden Sie nicht? Jeder kann auf einmal mit jedem reden. Und „überraschenderweise“ wollen die Menschen überall auf der ganzen Welt das Gleiche: In Frieden und Freiheit ihre Kinder großziehen und Spaß am Leben haben.
Erst der Angriff auf LiteLLM, und dann ging es in der letzten März-Woche Schlag auf Schlag. Die EU verliert 350 GByte Daten, der Identitätsdienstleister IDMerit sogar 1 TByte, Kash Patels E-Mail wird vom Iran gehackt, Axios (mit 750 Tsd Dependencies!) erleidet eine katastrophale Supply-Chain-Attack, Anthropic stellt versehentlich den gesamten Source-Code seines CLI-Tools online. Und dann war da noch Mercor AI, die 4 TB KYC-Daten verloren haben, übrigens im Zusammenhang mit dem LiteLLM-Hack. KYC (Know Your Customer)! Biometrische Daten, Personalausweisdaten, und dergleichen Einladungen zum Identitätsdiebstahl mehr. Tja, und gleichzeitig fordert die Politik weltweit Alterskontrollen im Netz. Das soll durch eine eID ermöglicht werden, mithin, für jeden Bürger soll es eine digitale Identität geben. Ist man sich eigentlich darüber im Klaren, dass laufend bewiesen wird, dass man unfähig ist, diese Daten zu schützen? Und was es bedeuten würde, wenn eine solche Datenbank öffentlich wäre?
KI spielt eine große Rolle bei diesem sich zunehmend entfaltenden Sicherheitsdesaster. Ghost ist ein super-populäres Open-Source-CMS (Headless Blogging/Website-Builder) mit über 50.000 GitHub-Stars. Das Projekt läuft seit ca. 20 Jahren (erste Version 2013, aber Wurzeln noch früher) und hatte noch nie eine kritische Sicherheitslücke (kein einziger CVE mit hohem/critical Impact in der gesamten Geschichte). Dann lässt der Anthropic-Researcher N. Carlini bei einer Live-Konferenz, ebenfalls in der Woche des Grauens Ende März, das Projekt von einer neuen Claude Code-Version analysieren, und ruckzuck wurde ein extrem kritischer SQL-Injection-Fehler gefunden, der ein Ghost-System komplett, mit allen Admin-Rechten, übernehmen kann.
KI trägt also zu diesen Sicherheitslücken bei, erstens, weil man sie damit viel leichter finden kann, zweitens, weil Anwender und Entwickler nachlässig werden und sich blind auf die KI verlassen. Andererseits sind es aber gerade KI-gestützte Tools, die enorm hilfreich sind bei der Aufdeckung solcher Vorfälle. Sowohl der Supply-Chain-Angriff auf LiteLLM als auch der auf Axios wurden sehr schnell von KI-Überwachungstools entdeckt.
Ich denke, menschliche Spezialisten werden auf lange Zeit unverzichtbar bleiben. Ohne KI-Unterstützung sind zwar auch diese längst chancenlos, doch Erfahrung und sektorübergreifender Blick sind und bleiben eine notwendige Ergänzung zum enormen Wissen der KI. Das weit grundlegendere Problem ist aber meiner Meinung, man sollte nicht zu rennen versuchen, bevor man gehen kann. Die enormen Möglichkeiten der IT lassen uns leicht vergessen, dass damit auch riesige Gefahren verbunden sind. Und wenn diese Risiken ignoriert werden, könnte das die gesamte informationstechnische Revolution zum Stillstand bringen – nicht zu wissen ist weniger gefährlich als falsch zu glauben.
Stellen Sie sich vor: Ihr Unternehmen betreibt eine Website, die jahrelang hervorragend in den Suchergebnissen von Google rankte. SEO wurde optimiert, Content wurde gepflegt, technische Standards wurden eingehalten. Und dann verändert sich die Welt. Immer mehr Nutzer stellen ihre Fragen nicht mehr klassisch in eine Suchmaschine ein, sondern lassen sich Antworten von KI-Chatbots generieren. Und genau diese KI-Systeme verstehen Ihre Seite nicht. Das Problem: Während Sie sich jahrelang auf die Regeln von Google-SEO konzentriert haben, entsteht gerade ein völlig neues Ökosystem – das der KI-gestützten Suche. Und die Regeln dort sind andere.