Open Source KI

https://github.com/deepseek-ai/DeepSeek-R1

We introduce our first-generation reasoning models, DeepSeek-R1-Zero and DeepSeek-R1. DeepSeek-R1-Zero, a model trained via large-scale reinforcement learning (RL) without supervised fine-tuning (SFT) as a preliminary step, demonstrated remarkable performance on reasoning. With RL, DeepSeek-R1-Zero naturally emerged with numerous powerful and interesting reasoning behaviors. However, DeepSeek-R1-Zero encounters challenges such as endless repetition, poor readability, and language mixing. To address these issues and further enhance reasoning performance, we introduce DeepSeek-R1, which incorporates cold-start data before RL. DeepSeek-R1 achieves performance comparable to OpenAI-o1 across math, code, and reasoning tasks.

Die chinesische Entwicklung des KI-Modells „DeepSeek“ sendet Schockwellen durch die Branche und lässt alle Tech-Aktien abstürzen, weil es viel günstiger ist als die Konkurrenz und deutlich weniger Trainingsaufwand benötigt. Im Artikel von Heise dazu kommt jedoch mMg. zu kurz, dass das Modell Open Source ist – ein Versprechen, das auch Sam Altman für OpenAI gegeben hatte, aber bis heute nicht eingelöst hat. In Verbindung mit den weit geringeren Hardware-Anforderungen kann man diese KI also auf einigermaßen leistungsfähiger Hardware selbst hosten.

Schreibe einen Kommentar Antwort abbrechen