Partielle Autonomie von Robotern: Der smarte Weg zur Automatisierung

Stellen Sie sich vor: Ein Lieferwagen rollt vor, ein kleiner Roboter springt heraus, navigiert geschickt über den Bürgersteig, stellt ein Paket vor Ihre Tür und fährt seelenruhig zurück. Kein Mensch in Sicht, keine Kratzer am Paket, pure Effizienz. Klingt nach Science-Fiction? Das ist heute schon Realität – und ein perfektes Beispiel für partielle Autonomie von Robotern.

In einem viralen Video auf X zeigt @kimmonismus genau das: Ein Roboter übernimmt die letzte Meile vom Van bis zur Haustür. Der Post hat über 415.000 Views und Tausende Likes – kein Wunder, es fühlt sich an wie der Startschuss für die Roboter-Revolution. Und es gibt bereits viele Unternehmen, die sich mit diesem Szenario beschäftigen, lesen Sie z.B. diesen Übersichtsartikel.

Das ist so ähnlich wie beim Programmieren. Eine komplexe Aufgabe, zum Beispiel in Buchhaltung oder Verwaltung, vollständig zu automatisieren, ist oftmals schwer bis unmöglich (jedenfalls ohne KI, aber auch damit sind die Ergebnisse bisher durchwachsen). Wenn man stattdessen aber eine Teilautomatisierung entwickelt, bei der der Mensch nur an den wesentlichen Stellen eingreift, für die abstraktes Verständnis oder Hintergrundwissen erforderlich ist, kann man mit sehr viel weniger Aufwand ein Programm erstellen, das bereits enorme Effizienzgewinne erbringt.

Ein guter Freund, leider inzwischen verstorben, sagte immer: 100% Perfektion ist die 100% Garantie für Unglück. Wir stellen uns unter der Roboter-Revolution immer vollständig autonome Maschinen vor, die alles ganz alleine erledigen können. Aber Hand in Hand mit dem Menschen, der die Dinge übernimmt, die dem Roboter schwerfallen, während der Roboter den Menschen von Dingen entlastet, die anstrengend oder repetitiv und langweilig sind, das scheint mir viel eher der Weg in die Zukunft zu sein.

Die Ära der KI-Browser

Perplexity und OpenAI haben basierend auf der freien Google-Engine Chromium zwei neue KI-Browser veröffentlicht. Das sind also sozusagen modifizierte Google Chrome Browser. Es gibt mittlerweile nur noch 3 Engines mit nennenswertem Marktanteil, Chromium, Gecko (Firefox), WebKit (Safari).

Diese KI-Browser Comet (Perplexity) und Atlas (OpenAI) werden als Angriff auf das Monopol von Google gehandelt. Lustig irgendwie, da doch Google denen jederzeit den „Saft abdrehen“ kann. Ich meine, es ist durchaus verständlich, dass man keinen neuen Browser schreibt, das würde wohl Jahre dauern und der Markterfolg wäre sehr ungewiss. Aber zu glauben, dass man mit einer Engine von Google deren Marktmacht angreifen könnte, finde ich ein wenig … verwegen.

Mal abgesehen davon, dass Google einen solchen KI-erweiterten Browser ja jederzeit selbst entwicklen kann. Mit Gemini haben sie auch eine eigene KI am Start, hängt zwar derzeit etwas zurück, ist aber dennoch eine sehr gute KI.

Warum lässt Google sich das gefallen? Werden sie zurückschlagen, und falls ja, wann? Ich glaube, Google ist einfach nur vorsichtiger und sich der Gefahren mehr bewusst. KI-Browser sind eigentlich agentische Anwendungen. Man soll dem KI-Browser geradezu unverschämt viel Rechte und Zugriff einräumen, und dann kann er ganz alleine ein Hotel buchen. So was. Die Leute hinter Brave (ein ebenfalls Chromium-basierter Browser mit Fokus auf Privatsphäre und Datensicherheit) haben jedoch aufgedeckt, dass agentische KI-Browser einer großen Gefahr unterliegen, für die es bisher keine Abwehr gibt: Prompt-Injection. Das bedeutet, eine böswillige Seite bringt in ihrem Code versteckte / unsichtbare Anweisungen unter, die gezielt eine KI angreifen sollen. Die dann irgendwas macht, aber nicht das, was der Anwender möchte.

Wir finden, KI-Browser sind eine sehr spannende Entwicklung, aber aktuell sollte man sie nicht für produktive Aufgaben einsetzen. Die ersten Praxistests sind im Übrigen ernüchternd: Die Erledigung einer Aufgabe dauerte mit KI-Browser länger, als die Benutzung der Funktionaliät einer Seite direkt.

Windows 10 Support-Ende

Mit dem heutigen Tag endet der Support für Windows 10. Allerdings noch nicht in der EU, dort gibt es noch ein weiteres Jahr Updates. Erstmal besteht also für hiesige Nutzer kein Grund zur Eile.

Es gibt allerdings eine ganze Menge Software, die sich weigert, noch unter Windows 10 zu funktionieren. Z.B. die Datev-Software. Es kann deshalb nötig sein, trotz weiter verfügbarer Updates für Windows 10 nun dringend wechseln zu müssen.

Aber was tun, wenn Microsoft den Rechner als inkompatibel für den Upgrade einstuft? Und wenn dort wichtige und umfangreiche Daten gespeichert sind, deren Migration auf einen neuen Rechner aufwändig, und vielleicht sogar gefährlich (Datenverlust) ist?

Die Kompatibilitätsanforderungen von Windows 11 lassen sich in drei Bereiche teilen: TPM, UEFI/GPT, Prozessor. Windows 11 setzt einen TPM-Chip voraus. Wenn es den nicht gibt, kann man im BIOS nachsehen, ob er vielleicht abgeschaltet ist.

Windows 11 will außerdem ein UEFI-BIOS mit GPT formatierter Festplatte. Wenn Ihre Festplatte noch MBR ist, gibt es Tools, um die Festplatte auf GPT umzustellen.

Bleibt noch das Thema des Prozessors. Es ist zwar so, dass das die einzige Beschränkung ist, die einen tatsächlichen technischen Sinn hat.  Windows 11 hängt tatsächlich von neueren Prozessor-Features ab. Trotzdem ist Microsoft auch damit über’s Ziel hinaus geschossen, es schließt Prozessoren aus, die die benötigten Funktionen durchaus aufweisen, aber das ist Microsoft egal, es besteht auf ziemlich neuen Prozessoren.

Für dieses Prozessor-Problem bleibt nur der Rückgriff auf Rufus. Rufus kann aber auch die anderen Probleme umgehen, bedeutet, mit Rufus kann man ein Win11-Installations-Image erstellen, das weder TPM, GPT, noch einen neuen Prozessor benötigt. In diesem speziellen von Rufus generierten Image sind die Prüfungen dazu abgeschaltet.

Für die Details, wie Sie mit Rufus ein solches Image für Ihren PC erstellen können, fragen Sie bitte die KI Ihres Vertrauens. Wenn Sie das geschafft haben, können Sie auch auf einem eigentlich inkompatiblen PC einen Inplace-Update auf Windows 11 ausführen, der die Lizenz, Ihre Daten und alle Einstellungen übernimmt.

Eine Gewähr, dass Microsoft nicht etwa zukünftig diese Prüfungen noch einmal in ein Windows 11 Update einbaut, und dann eine solche Rufus-Installation nachträglich deaktiviert, gibt es aber natürlich nicht. Insofern, wenn Ihre Probleme nur TPM und/oder MBR sind, versuchen Sie es erst einmal mit den oben beschriebenen Wegen, das ist bestimmt zukunftssicherer.

VM Falle


Wer unter Linux arbeitet, hat vielleicht ein VM für Windows. Es gibt ja nach wie vor Anwendungen, die nur unter Windows laufen. Eine solche Anwendung ist Banking-Software, die einen Chipkarten-Leser einbindet.

Es gibt da zwar das eine oder andere für Linux, aber für professionelle Anforderungen sieht es mau aus. An sich ist das kein Problem, man reicht den USB Port des Chipkartenlesers an die VM durch, und dann kann die Banking-Software den auch problemlos anprechen.

Allerdings gibt es dabei eine Tücke. Der Linux-Treiber pcscd bekommt davon nichts mit. Und dann flutet er drei mal in der Sekunde das syslog und beschwert sich darüber. Das ist nicht nur ein Platzproblem, das ist so häufig, dass es zu Deadlocks führen kann, und in anderen Anwendungen Daten verlorengehen.

pcscd wird zudem automatisch installiert, wenn ein Chipkartenleser gefunden wird. Wenn man also das Problem nicht bemerkt, dann passiert es im Hintergrund und fällt gar nicht auf. Linux ist durchaus sehr effizient mit seinem Journal und bügelt das scheinbar weg.

Mithin, wer einen Chipkartenleser an eine Windows-VM durchreicht, sollte den pcscd Dienst abschalten und maskieren:

sudo systemctl disable --now pcscd.service pcscd.socket
sudo systemctl mask pcscd.service pcscd.socket

Es geht dabei nicht nur um das journal. Im Durchschnitt 16 Meldungen in der Sekunde sind zwar heftig und machen das journal kaum noch brauchbar. Wichtiger finde ich aber, dass dauernd der USB-Stack bombardiert wird, mit Timeouts und all das. Das könnte durchaus die Systemstabiltät beeinflussen.

Kampf der Giganten

https://kinews24.de/ki-wettlauf-usa-china-analyse-2025/

Der KI-Wettlauf um die globale Vorherrschaft bei Künstlicher Intelligenz zwischen den USA und China ist im September 2025 in eine neue, gefährlichere Phase eingetreten. Der technologische Vorsprung Amerikas ist auf wenige Monate geschrumpft, was in Washington eine „KI-Sputnik-Angst“ auslöst. Während US-Präsident Donald Trump mit einer radikalen Deregulierung die Innovationskraft der US-Industrie entfesseln will, kontert China mit dem Vorschlag globaler Regeln und formt eine Allianz des Globalen Südens. Es ist kein reiner Wettbewerb um Algorithmen mehr – es ist ein Kampf um Standards, Infrastruktur und die digitale Weltordnung.

Der Wettkampf um KI-Dominanz zwischen den USA und China ist längst kein abstrakter technischer Wettbewerb mehr, sondern ein zentraler geopolitischer Faktor. 2025 scheint ein Schlüsseljahr zu sein: Der Abstand schrumpft, politische Entscheidungen werden richtungsweisend, und das Kräfteverhältnis könnte sich in kurzer Zeit verschieben. Wird USA ihre Position als weltweit führende Wirtschaftsmacht erhalten können?

Touchscreens im Auto als Unfallrisiko

https://www.golem.de/news/unfallrisiko-touchscreens-im-auto-gefaehrlicher-als-alkohol-2509-200318.html

Touchscreens sind längst Standard in modernen Autos geworden, doch es gibt zunehmend Belege dafür, dass diese digitalen Bedienelemente gefährliche Fahrsituationen schaffen können. Sicherheitsorganisationen führen nun neue Richtlinien ein, die das Fahrzeugdesign grundlegend verändern könnten, wie The Economist berichtet.

Mich wundert schon lange, dass die Nutzung von Handys so streng sanktioniert wird, aber die Bedienelemente im Auto immer mehr visuelle Aufmerksamkeit erfordern. Das „alte“ Verfahren, bei dem man nach einer Eingewöhnungszeit blind alle Bedienelemente finden und benutzen konnte, ohne die Augen von der Straße zu nehmen, hatte durchaus seine Vorteile.

Politbüro im Destruktionsmodus

https://www.it-boltwise.de/airpods-pro-3-ki-uebersetzung-bleibt-in-europa-gesperrt.html

Apple hat seine neuen AirPods Pro 3 vorgestellt, die mit einer innovativen Echtzeit-Übersetzungsfunktion ausgestattet sind. Doch während Nutzer in den USA und anderen Regionen von dieser Technologie profitieren können, bleibt sie für europäische Kunden aufgrund von EU-Regulierungen unzugänglich. Diese Entscheidung wirft Fragen über die zukünftige Verfügbarkeit von KI-Diensten in Europa auf.

Es ist nach wie vor schwierig, profitable Anwendungen für KI zu finden. Mal abgesehen von Unterstützung beim Programmieren ist bisher wenig in Sicht, mit dem sich die enormen Anschub-Investitionen zurückverdienen lassen. Viele KI-Projekte enttäuschen und produzieren nur noch mehr Kosten.

Dann findet Apple eine geniale und äußerst sinnvolle Anwendung, und was macht die EU? Sie scheint nur mit aller Macht daran arbeiten zu wollen, Europa zu zerstören, indem sie es vom technologischen Fortschritt abhängt – und verbietet Apple natürlich den Einsatz dieser Idee. Denn die verkrusteten und sozialistischen Politbüro-Strukturen der EU werfen so enorme Risiken für Anbieter auf, dass die eben Europa lieber links liegen lassen.

Unsere Zukunft wird sabotiert, mit voller Absicht. Wozu eigentlich?

Quod licet Iovi, non licet bovi

https://www.golem.de/news/eu-kommission-von-der-leyen-laesst-textnachrichten-automatisch-loeschen-2509-199715.html

Die EU-Kommission verzichtet bewusst auf die Archivierung wichtiger Kommunikationsinhalte auf ihrer Führungsebene. Einem Bericht des Portals Follow the Money zufolge ist es aus diesem Grund nicht möglich, per Informationsfreiheitsanfrage an Textnachrichten an und von EU-Kommissionspräsidentin Ursula von der Leyen zu gelangen.

Während der Bürger nach den Vorstellungen der Europäischen Union bald KI-gestützte Live-Durchsuchungen seiner privaten Kommunikation in Chat-Anwendungen wie Whatsapp erdulden soll, scheuen die Führer das Licht der Öffentlichkeit wie der Teufel das Weihwasser. Hmmm. Wie war das gleich nochmal mit diesem „Wer nichts zu verbergen hat“?

Spät dran kann von Vorteil sein

https://docs.x.ai/docs/overview

We’re thrilled to introduce grok-code-fast-1, a speedy and economical reasoning model that excels at agentic coding.

Viele Entwickler schwören auf Claude AI von Anthropic, da es für Coding-Aufgaben optimiert ist. Anthropic hat sich bereits vor einiger Zeit auf die Zielgruppe der SW-Entwickler fokussiert, weil dort derzeit der höchste Nutzen von KI erzielt werden kann.

Auch xAI scheint dies nun erkannt zu haben und stellt mit Grok Code Fast 1 ein Modell vor, das speziell für Softwareentwicklung optimiert ist. Mit einer Verarbeitungsgeschwindigkeit von bis zu 92 Token pro Sekunde ist es eines der schnellsten Modelle für interaktive Anwendungen in Entwicklungsumgebungen (IDEs). Es eignet sich besonders für Echtzeit-Anwendungen wie in-editor Code-Vervollständigungen. Das Modell unterstützt einen Kontext von 256.000 Token, was es ermöglicht, große Codebasen, lange Verläufe oder mehrdateilige Projekte in einer Sitzung zu verarbeiten.

xAI gibt außerdem an, das neue Modell sei besonders für agentische Aufgaben optimiert. Na, dann sind wir mal gespannt, ob xAI aus den erheblichen Schwierigkeiten (Datenverlust, Sicherheitsprobleme) von Anthropic mit solchen Agenten etwas gelernt hat.

Immer noch auf Anfänger-Niveau

https://www.golem.de/news/zukunft-der-llms-wie-llms-aktuelle-grenzen-ueberwinden-koennten-2508-199245.html

Nach einer regelrechten Explosion der Zahl neuer KI-Modelle und Anbieter, insbesondere für Sprachmodelle, scheint die Entwicklung aktuell eher langsam voranzugehen: Neue Modelle, etwa jüngst GPT-5, enttäuschen, was ihre Performance angeht. Die Sprünge zwischen den Generationen werden gefühlt kleiner, trotz mehr Rechenleistung und immer größerer Modelle.
Anstatt immer mehr Leistung oder Anpassungen an der sonst relativ gleichbleibenden Architektur vorzunehmen, könnte ein Paradigmenwechsel helfen: weg von Tokens, weg von Modellen, die Wort für Wort Texte formen, weg von statischen Modellen, die sich nicht mehr anpassen lassen.

Aktuelle LLMs auf Transformer-Basis scheinen an eine Art Plateau geraten. Technologien wie GPT-5 liefern zwar solide und bereits durchaus beeindruckende Ergebnisse, doch der technologische Durchbruch bleibt aus.  Und ohne menschliche Kontrolle geht es gar nicht, wie schon allein das Problem der KI-Halluzinationen belegt. Ein Blick in die Zukunft zeigt, dass nur ein struktureller Wandel – etwa durch hierarchische Tokenverarbeitung oder vollkommen neue Modellarchitekturen – weitere Fortschritte bringen kann.

Praktisch und gefährlich

https://www.heise.de/news/Neue-Tricks-mit-QR-Codes-10559942.html

Neue Tricksereien mit QR-Codes melden Sicherheitsforscher von Barracuda. Die Angriffe kommen per E-Mail und umgehen viele der in großen Unternehmen üblichen Sicherheitsscans. Liest der Endnutzer seine E-Mails dann auch noch mit aktivierter HTML-Darstellung, wird er leicht zum Opfer.

QR-Codes sind außerhalb geschlossener Systeme stets mit Vorsicht zu genießen; man sollte ihnen gegenüber grundsätzlich skeptisch bleiben und – insbesondere bei sensiblen Inhalten – in E-Mails niemals öffnen. Man sollte auch das automatische Öffnen von Links in QR-Codes abschalten und eine URL darin immer zuerst genau prüfen. Generell gilt, den Link in einem QR-Code nur zu öffnen, wenn man die Quelle des Codes zweifelsfrei identifizieren kann und ihr vertraut.

Angst vor der eigenen Courage?

https://www.youtube.com/watch?v=vV7YgnPUxcU

The billionaire Peter Thiel is unimpressed with our pace of innovation. In this episode, he critiques artificial intelligence, longevity science and space travel — and warns that our lack of progress could lead to catastrophic outcomes, including the emergence of the Antichrist.

In diesem sehr interessanten Interview der New York Times mit Peter Thiel erfährt man viel von den Ideen und Sorgen, die Peter Thiel antreiben. Bemerkenswert fand ich, dass seine größte Angst einem One-World-Government gilt, das würde notwendig in einen autoritären Polizeistaat kippen, meint er. Lustig, es sind doch gerade die Tools seines Unternehmens Palantir, die mehr als so ziemlich alles andere das Potential für eine solche globale Tyrannei mit sich bringen.

Wenn die KI zurücklächelt

https://www.golem.de/news/nach-nutzeraufstand-openai-bringt-gpt-4o-zurueck-2508-198999.html

Bereits einen Tag, nachdem das Unternehmen GPT-5 als Standard für alle Nutzer eingeführt hatte, kündigte CEO Sam Altman auf X an, dass zahlungspflichtige Abonnenten wieder die Möglichkeit erhalten würden, die vorherige Modellversion auszuwählen. Dazu muss man in den Einstellungen wählen, dass auch alte Modelle eingeblendet werden.

Es gibt Anwendungen, für die eignet sich GPT-5 tatsächlich besser, bei anderen Themen fällt es aber schon sehr auf, dass GPT-5 kälter und distanzierter ist. Sam Altman hatte sich so gewünscht, dass OpenAI-Versionschaos zu beenden, GPT-5 sollte sich automatisch auf das passende Verhalten einstellen. Klappt aber noch nicht so recht.

Überraschend an dem ganzen Thema finde ich zudem, wie viele Menschen offenbar eine soziale Beziehung zur KI aufbauen. Ich weiß nicht, ob das gut oder schlecht ist. Ist es schlecht, weil man den Kontakt zu seinen Mitmenschen verliert? Oder ist es vielleicht gut, weil die KI uns nicht hassen wird (wie in „Terminator“), sondern uns als Freunde sehen wird (wie in den „Culture“-Romanen von Iain Banks).

GPT-5 in der API – was sich geändert hat

https://www.heise.de/news/GPT-5-OpenAI-veroeffentlicht-neues-Sprachmodell-fuer-ChatGPT-10513244.html

OpenAI veröffentlicht[e] am Donnerstagabend [7.8.25] sein neues Sprachmodell GPT-5. Das neue Modell soll zuverlässiger antworten und weniger halluzinieren als seine Vorgänger. Zudem könne es Fachfragen auf Expertenniveau beantworten, erklärt das Unternehmen. Als Beispiele nannte OpenAI unter anderem auch Aufgaben in Risikobereichen wie dem Finanz- und Gesundheitswesen.

OpenAI hat jedoch mit GPT-5 nicht nur die Modellqualität verbessert, sondern auch subtile Änderungen an der API-Ausgabe vorgenommen. Für viele gängige Client-Bibliotheken, z.B. für NodeJS, ist zwar nur ein Update notwendig, um auf das neue Format umzustellen. Ohne diesen Update steht man allerdings zunächst ziemlich ratlos da, weil bewährter Code auf einmal nicht mehr funktioniert.

Die Umstellung des Rückgabeformats hat laut OpenAI zum Ziel, ein einheitliches Schema für Text, Tool-Aufrufe, Reasoning-Blöcke, mehrere Ausgabekanäle usw. zu definieren. Der Sinn ist ein konsistentes, strukturiertes Format über alle Features (Parallel-Tools, Multimodal, Reasoning-Zusammenfassungen, Streaming). Zumal GPT-5 nun selbstständig entscheidet, welche Features, wie z.B. Reasoning, es für eine Aufgabe hinzuschaltet.

Wie gesagt, ein Update der OpenAI-Developer-Libraries reicht i.Allg. aus, wer jedoch eigene API-Implementierungen nutzt oder exotischere Umgebungen wie VBA, muss unter Umständen nacharbeiten:

Escape-Verhalten: GPT-5 liefert die Inhalte in JSON mit stärkerem Escaping, besonders bei Umlauten und Sonderzeichen.

Textstruktur: Anstelle einer einfachen message.content-String-Ausgabe ist der Text nun als Array von Objekten („content“: [{ „type“: „text“, „text“: „…“ }]) verschachtelt.

Unicode-Darstellung: Einige Zeichen (z. B. Umlaute) werden jetzt als Unicode-Escape \u00FC statt direkt als UTF-8 geliefert – je nach Client kann das korrekt dekodiert werden oder nicht.

Notabene, es ist immerhin der eigene Industrie-Standard, den OpenAI mit dieser Änderung beerdigt. Sprich, so ziemlich alle Anbieter (Grok, Claude, Gemini) unterstützen den alten Standard, und jetzt schafft OpenAI ihn nur für GPT-5 ab (die anderen OpenAI-Modelle verstehen ihn nach wie vor). Das ist durchaus ein wenig … überraschend, insbesondere weil es so still und heimlich geschieht.

Pezi als Sündenbock

https://norberthaering.de/news/drv-pauschalierung/

Die Deutsche Rentenversicherung sah sich außerstande, einen erhöhten Pflegeversicherungssatz einzuprogrammieren. Die Regierung nutzt das, um den Rentnern etwas mehr abzuknöpfen als vorgesehen. Auch in Sachen Cybersicherheit ist der Staat hochgradig minderbemittelt unterwegs. Trotzdem will er seine Bürger zwingen, in allen Lebensbereichen ins Netz zu gehen.

Es kann einen schon gruseln, immer mehr Bürokratie und Vorschriften werden über jeden Lebensbereich gekippt, niemand blickt mehr durch, also soll jetzt alles digital werden. Weil ja alles so komplex geworden sei, dass nur noch mit Computer … Nun, wenn man ein Problem nicht versteht, dann hilft auch ein Computer nichts. Aber man kann dann zumindest sagen, dass der Computer schuld ist.