(Animiertes Beitragsbild eines anderen unserer Blog-Artikel)
https://aaron.de/index.php/2025/03/01/wan-2-1-mit-comfyui-inkl-gpu-support-lokal-einrichten/
ComfyUI ist eine node-basierte Benutzeroberfläche zur Steuerung und Modifikation von KI-Modellen zur Bild- und Videoerstellung. Wan 2.1 ist ein Text-to-Video-Modell (T2V), das speziell für die Generierung von Videos auf Basis von Texteingaben entwickelt wurde.
Diese Anleitung beschreibt Schritt für Schritt, wie ComfyUI mit Wan 2.1 lokal eingerichtet wird. Jeder Abschnitt erklärt die benötigten Komponenten, warum sie notwendig sind und wie sie korrekt installiert werden. Diese Anleitung setzt Python 10 und eine GPU mit CUDA-Support voraus.
WAN2.1, entwickelt von Alibaba, revolutioniert die Videogenerierung: Mit nur 12 GB VRAM (16 GB für 720p) können Unternehmen und Kreative hochwertige Videos erstellen. Seit Februar 2025 unterstützt ComfyUI dieses Open-Source-Modell nativ, das Text-zu-Video, Bild-zu-Video und mehr ermöglicht (Hugging Face Blog). Das 1.3B-Modell benötigt nur 8,19 GB VRAM und generiert 5-Sekunden-Videos in 480p in etwa 4 Minuten – erschwinglich für Consumer-GPUs wie eine RTX 4060Ti. Nutzer berichten sogar von 720p-Videos mit 16 GB VRAM, wenn auch mit längeren Renderzeiten.
Die Möglichkeiten sind beeindruckend: WAN2.1 ist das erste Modell, das sowohl chinesischen als auch englischen Text in Videos erzeugen kann, und eignet sich für Marketing, Werbung oder kreative Projekte. Oben sehen Sie ein animiertes Video, das aus einem ebenfalls mit KI generierten Beitragsbild eines anderen Eintrags auf unserem Blog erzeugt wurde.
Doch es gibt Hürden: ComfyUI bietet keine Zugriffsverwaltung, und obwohl man dies über eine HTAUTH-Anmeldung via Apache sozusagen nachrüsten könnte, bedeutet es trotzdem, dass bei öffentlichem Zugang jeder die Inhalte anderer Nutzer sehen könnte – ein großes Datenschutzproblem. Während Open WebUI für Bilder eine Integration bietet, fehlt die Videounterstützung. Daher nutze ich WAN2.1 derzeit nur lokal und warte, bis Open WebUI auch Videos unterstützt, bevor ich es für unser Unternehmen freigebe.
In Europa bremst zudem die Regulierung den Fortschritt. Das KI-Gesetz und die DSGVO erschweren den Einsatz: Daten für KI-Training sind schwer zugänglich, und die Kennzeichnungspflicht für KI-Inhalte schafft zusätzliche Hürden. Ab August 2025 drohen Strafen von bis zu 35 Millionen Euro bei Verstößen – ein Risiko, das viele Unternehmen scheuen lässt. Während andere Regionen WAN2.1 voll ausreizen, müssen wir in Europa Mitarbeiter schulen oder deren KI-Nutzung überwachen, um rechtliche Probleme zu vermeiden.
Wir sehen das Potenzial von WAN2.1, aber auch die Frustration. Die EU muss ihre Ambitionen mit der Realität abgleichen – weniger Bürokratie, mehr Pragmatismus. Sonst verpasst die EU den Anschluss, während andere die Zukunft der Videogenerierung gestalten.