NVIDIA Blackwell GPUs unter Linux

Admin verzweifelt am Grafikkarteneinbau. KI-generiert (Nano Banana 2).

Wer eine NVIDIA RTX PRO 6000 Blackwell (oder andere Blackwell-GPUs) unter Linux betreiben will, steht vor drei Hürden: Zwingend erforderliche Open-Source-Kernel-Module, aktuelle Treiber (mindestens Version 570+) und häufig ein Mainboard-BIOS-Update. Dieser Artikel dokumentiert unsere Erfahrungen aus der Praxis.

Das Problem: Blackwell ist anders

NVIDIAs neue Blackwell-Architektur bringt beeindruckende Hardware – die RTX PRO 6000 Blackwell etwa bietet 96 GB VRAM in einer Karte und ist bis zu 30% schneller als die Ada-Generation. Doch beim Einbau in bestehende Linux-Workstations oder Server zeigt sich: Die Installation ist nicht trivial.

Anders als bei früheren GPU-Generationen (Ada Lovelace, Ampere) gelten für Blackwell besondere Anforderungen:

1. Open-Source-Kernel-Module sind Pflicht

Ab der Treiber-Serie 560 hat NVIDIA die Open-Source-Kernel-Module zum Standard gemacht. Für Blackwell-GPUs geht es noch weiter: Die proprietären Kernel-Module funktionieren nicht mehr. Das ist eine fundamentale Änderung:

„From Blackwell, only the open source kernel module can be used. The GSP cannot be deactivated.“ NVIDIA Developer Forum

Konkret bedeutet das:

Paket nvidia-driver-xxx → funktioniert nicht
Paket nvidia-driver-xxx-open → erforderlich

2. Treiber-Mindestversion: 570+

Blackwell-GPUs werden erst ab der Treiber-Serie R570 unterstützt. Für optimale Kompatibilität empfehlen wir die aktuelle R580-Serie zusammen mit CUDA 13.0.

NVIDIA-Treiber mindestens 570.x // empfohlen 580.x
CUDA Toolkit mindestens 12.8 // empfohlen 13.0

3. Mainboard-BIOS-Update oft notwendig

Ein häufig übersehenes Problem: PCIe-Link-Training-Fehler. Blackwell-GPUs nutzen PCIe 5.0, und viele ältere BIOS-Versionen haben Schwierigkeiten mit dem Link-Training.

Symptome: GPU wird nicht erkannt. Oder GPU wird erkannt, läuft aber nur mit PCIe Gen 1 (statt Gen 4/5). Performance-Einbrüche (statt 38 Token/s nur 2 Token/s bei LLM-Inferenz). Instabilität unter Last.

Lösung: Mainboard-BIOS auf die neueste Version aktualisieren. In unserem Fall (ASUS Pro WS WRX90E-SAGE SE) war ein Update von April auf November 2025 notwendig, um PCIe Gen 4 zu erreichen.

Weiterführende Links

NVIDIA Driver Installation Guide – Kernel Modules
https://docs.nvidia.com/datacenter/tesla/driver-installation-guide/kernel-modules.html

NVIDIA Developer Forum – RTX PRO 6000 Blackwell
https://forums.developer.nvidia.com/t/rtx-pro-6000-blackwell-workstation-edition-driver-support/332701

Level1Techs Forum – Blackwell Setup Guide Ubuntu
https://forum.level1techs.com/t/wip-blackwell-rtx-6000-pro-max-q-quickie-setup-guide-on-ubuntu-24-04-lts-25-04/230521

Level1Techs Forum – PCIe Gen 1 Problem WRX90
https://forum.level1techs.com/t/dual-rtx-pro-6000-blackwell-on-wrx90-pcie-stuck-at-gen-1-anyone-else/242079

Phoronix – NVIDIA CUDA 13.0
https://www.phoronix.com/news/NVIDIA-CUDA-13.0

GitHub – vLLM Blackwell Setup Guide
https://github.com/Audible83/vllm-blackwell-setup

Kleiner Tipp noch: Wenn Sie nvtop oder nvidia-smi ausführen, erschrecken Sie vielleicht, wenn es heißt „PCIe Gen1“. Das sind aber nur Stromsparmechanismen. Lassen Sie nvtop während einer Inferenz laufen, und die Anzeige sollte auf Gen4 oder 5 gehen (falls nicht, haben Sie tatsächlich ein Problem 😀).

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert