Ollama 7 mit Bilderkennung

„Welche Vogelart zeigt dieses Bild?“ Meta Llama 4 Scout: Das Bild zeigt zwei Stieglitze. Mit der neuen Version 7 kann Ollama nun Bilder analysieren und ihren Inhalt beschreiben. Das ist für Bilder, die man kennt, natürlich nur von geringem oder eher akademischem (Test-) Interesse. Interessant wird es, wenn man ein Bauteil im Auto identifizieren will, …

Gut gerüstet ist halb gewonnen

Sie sind Entwickler und haben schon viel von der enormen Leistungsfähigkeit der KI beim Coden gehört. Sie spüren, das wird die ganze IT-Branche verändern, und Sie möchten sich auf die neuen Technologien einstellen. Als ITler muss man ja ohnehin ständig dazulernen, kein Problem, denken Sie. Also benutzen Sie zum ersten Mal eine KI für Ihren …

Der Wal meldet sich mit einem Paukenschlag zurück

DeepSeek V4 ist am 24. April in zwei Versionen „Pro“ und „Flash“ erschienen, und wie versprochen ist es Open Source. Die Qualität ist sehr gut, und die Preise bemerkenswert niedrig. Läutet schon das Totenglöcklein für OpenAI und Anthropic? Mehrere Coding-Spezialisten haben das neue Modell von DeepSeek schon unter die Lupe genommen, und deren Urteil ist …

Geniales Marketing oder perfider Trick?

Wer OpenClaw verwendet, wird schnell feststellen, dass der Token-Verbrauch enorm werden kann. „Erinnerungen auf Steroiden“ haben ihren Preis. Zwar sind die Kosten für Input-Token immer deutlich niedriger als die Kosten für Output-Token, aber wenn jedesmal ein riesiger Berg von Kontext mit dem Prompt mitgeschickt wird, summiert sich das sehr schnell. Hinzu kommt, dass die großen …

Open Source KI-Integration für VSCodium

Manchmal findet man eine coole Anwendung, und dann scheitert man an etwas völlig Banalem. Eine solche fiese Stolperfalle, die kaum dokumentiert ist, noch nicht einmal beim Hersteller, möchten wir Ihnen heute vorstellen. Neulich schrieben wir über VSCodium, die Open Source Alternative zu VS Code von Microsoft. Wer die Hoheit über seine Daten und keine Telemetrie …

Die schärfsten Kritiker der Elche sind selber welche

Update: Dieses Tool ist in einer verbesserten Version auf unserem Github verfügbar https://github.com/Cephei-OpenSource/dialsynth Als kritischer und verantwortungsbewusster KI-Anwender, wie gehen Sie vor? Die Gefahr von Halluzinationen und Auslassung wichtiger Details ist sehr real. Man sollte sich also niemals blind auf die Auskunft einer KI verlassen. Also wird man zunächst eine Websuche durchführen und damit die …

Ihr Terminal als Co-Developer

Agentische Coding-Assistenten haben sich in kurzer Zeit von „Autocomplete auf Steroiden“ zu handlungsfähigen Tools entwickelt: Sie verstehen ein Repository, schlagen nicht nur Code vor, sondern führen auch Aufgaben aus, bearbeiten mehrere Dateien, erstellen Commits/PRs, starten Tests und erklären Architekturentscheidungen – direkt dort, wo Entwickler ohnehin arbeiten: im Terminal. Wir stellen Ihnen heute drei aktuelle Vertreter …

Flucht aus dem Walled Garden

Wer im KI-Bereich arbeitet, kennt das Problem: Auf dem Smartphone sammelt sich schnell ein ganzer Zoo an Apps an. Eine App für ChatGPT, eine für Claude, eine für Gemini und vielleicht noch Perplexity. Das nervt nicht nur, es schränkt auch ein. Man ist an die Oberfläche und die Einschränkungen des jeweiligen Anbieters gebunden. Für den …

OpenAI unter Druck, zeigt aber große Resilienz

https://www.gamestar.de/artikel/chatgpt-52-die-3-groessten-neuerungen,3444875.html Es kriselt bei OpenAI – so viel ist klar. Seit dem Release von Gemini 3 und Nano Banana (Pro) sieht OpenAI-CEO Sam Altman ein, dass ChatGPT dem Konkurrenten von Google etwas hinterherhinkt. Und der im Mainstream etwas weniger bekannte Anbieter Anthropic hat mit Claude starke Konkurrenz am Start, die ich persönlich übrigens sehr gerne …

Chatbox AI – Das Schweizer Taschenmesser für KI-Interaktion

Wie viele Browser-Tabs haben Sie gerade offen? Und in wie vielen davon läuft eine KI-Session? Für Entwickler sind LLMs (Large Language Models) längst kein Hype mehr, sondern ein tägliches Werkzeug – sei es für Boilerplate-Code, Debugging oder Refactoring-Ideen. Aber die Standard-Weboberflächen von ChatGPT, Claude oder Gemini haben ihre Grenzen. Sie zwingen zum Kontextwechsel in den …

Fortschritt oder Kontrollverlust?

https://www.heise.de/news/Llama-4-Meta-veroeffentlicht-neue-KI-Modelle-10342223.html Vier neue KI-Modelle soll es geben, zwei sind bereits veröffentlicht worden: Llama 4 Scout und Maverick sind als offene Modelle verfügbar, Behemoth ist zunächst noch eine Preview, ebenso soll Llama 4 Reasoning bald auf den Markt kommen. Mark Zuckerberg hat in einem Video bei Instagram die neuen Modelle vorgestellt. Dort spricht er auch wieder …

KI für alle: Von Georgi Gerganovs Vision zu Microsofts bitnet.cpp

Die Zukunft der KI liegt nicht nur in den Händen der Tech-Riesen – sondern auch in denen von Entwicklern wie Georgi Gerganov, dem Mastermind hinter Ollama. Gerganov, ein bulgarischer Programmierer, hat mit seinem Framework llama.cpp die Grundlage dafür geschaffen, dass leistungsstarke Sprachmodelle (LLMs) lokal auf normaler Hardware laufen können. Tools wie Ollama, die auf llama.cpp …

Grok goes Telegram

https://techstory.in/elon-musks-grok-ai-expands-to-telegram-reaching-over-1-billion-users/ Elon Musk’s xAI has taken a significant step in expanding its advanced AI chatbot, Grok, by integrating it into Telegram. This marks Grok’s first major expansion beyond its original platform, X (formerly Twitter), and positions it as a key player in the competitive AI landscape. With over 1 billion monthly active users on Telegram, …

Gemma 3: Googles neues Meisterwerk im KI-Rennen

https://blog.google/technology/developers/gemma-3/ Today, we’re introducing Gemma 3, a collection of lightweight, state-of-the-art open models built from the same research and technology that powers our Gemini 2.0 models. These are our most advanced, portable and responsibly developed open models yet. They are designed to run fast, directly on devices — from phones and laptops to workstations — …