„Welche Vogelart zeigt dieses Bild?“ Meta Llama 4 Scout: Das Bild zeigt zwei Stieglitze.
Mit der neuen Version 7 kann Ollama nun Bilder analysieren und ihren Inhalt beschreiben. Das ist für Bilder, die man kennt, natürlich nur von geringem oder eher akademischem (Test-) Interesse. Interessant wird es, wenn man ein Bauteil im Auto identifizieren will, dessen Funktion einem unbekannt ist. Oder Tier- und Pflanzenarten herausfinden möchte. Im Ausland ein fremdsprachliches Schild verstehen will. Einen Chip auf dem Motherboard zuordnen. Oder auch in der Medizin mausert sich KI-Bildanalyse immer mehr zu einem äußerst hilfreichen Tool, wie kürzlich mehrere Studien, z.B. im Lancet, bestätigt haben.
Ich glaube zwar, der Mensch mit seiner Intuition und seiner disruptiven Phantasie bleibt unverzichtbar. Aber für Standardaufgaben und als Kontrolle für menschliche Schussligkeit ist KI ein hervorragendes Werkzeug, und sie wird immer besser.
Auch Sie können übrigens Ihre eigenen KI aufbauen und dazu das neue Ollama 7 installieren. Modelle mit bis zu 32 Milliarden Parametern (32b) lassen sich damit auch auf einigermaßen erschwinglicher Hardware (Grafikkarte mit min. 24 GB VRAM) sehr performant ausführen. Tipps dafür finden Sie bei uns im Blog, z.B. hier oder hier.