Wiki
Open Weights vs. Open Source vs. Fully Open
„Offen" sind drei verschiedene Versprechen
Das Wort „offen" wird Modellen aufgedrückt, die dir sehr Unterschiedliches schulden. Ein Modell, das du herunterladen kannst, ist nicht zwingend eines, das du kommerziell nutzen darfst, und ein Modell mit freizügiger Lizenz ist nicht zwingend eines, das du prüfen kannst. Für einen souveränen, selbstgehosteten Stack ist die Frage open weights vs open source keine Wortklauberei: sie entscheidet, ob du ausliefern darfst, ob du belegen kannst, was das Modell ist, und in einem bemerkenswerten Fall, ob du es überhaupt in der EU einsetzen darfst. Es gibt drei Stufen.
Open Weights
Open Weights heißt: Die trainierte Modelldatei ist herunterladbar und ausführbar. Du ziehst sie, lädst sie in eine Runtime und bekommst offline Antworten. Was du nicht zwingend bekommst, sind die Trainingsdaten, der Trainingscode oder eine uneingeschränkte Lizenz. Die Gewichte sind ein fertiges Artefakt, übergeben ohne Rezept, und die mitgelieferte Lizenz kann die Nutzung beschränken.
Die meisten bekannten lokalen Modelle sind zumindest Open Weights: Gemma, Qwen, Mistral und Llama liefern alle herunterladbare Gewichte. Das reicht, um privat auf eigener Hardware zu laufen. Aber „ich kann es laufen lassen" und „ich darf es dafür laufen lassen" sind zwei Fragen, beantwortet von der Lizenz, nicht vom Download-Button.
Open Source
Open Source ist Open Weights plus eine wirklich freizügige Lizenz: typischerweise Apache-2.0 oder MIT. Diese Lizenz ist der kommerziell entscheidende Teil: Sie gewährt dir das Recht, das Modell geschäftlich zu nutzen, zu verändern und zu betreiben, ohne zu fragen, ohne zu zahlen und ohne Nutzungsklauseln, über die man stolpert.
Das ist die Stufe, die die meisten Teams eigentlich wollen. Gemma 4 ist Apache-2.0 (zur Veröffentlichung am 02.04.2026 von einer eigenen Lizenz gewechselt). Qwen3.5 ist Apache-2.0. Die kleinen Modelle von Mistral waren historisch Apache-2.0. Damit ist die Rechtsfrage geklärt, bevor du anfängst. Deshalb ist ein Apache 2.0 LLM die sichere Standardwahl für ein Produkt, das du verkaufen willst.
Fully Open
Fully Open geht über die Lizenz hinaus: Es veröffentlicht die Gewichte, die Trainingsdaten, den Trainingscode und die Zwischen-Checkpoints. Damit ist das Modell reproduzierbar und prüfbar: du siehst, worauf es trainiert wurde, kannst nachvollziehen, wie es gebaut wurde, und Behauptungen darüber überprüfen, statt sie zu glauben.
Die Referenz ist OLMo 3 von Ai2, ausdrücklich als Fully-Open-Modell gebaut. Auf EU-Seite folgt EuroLLM derselben Philosophie. Fully Open ist die stärkste Position für Souveränitäts- und Compliance-Käufer, denn „wir können genau zeigen, was dieses Modell ist" ist eine grundlegend stärkere Aussage als „vertrau uns".
Warum der Unterschied zählt
Aus der Stufe eines Modells folgen drei praktische Konsequenzen.
- Kommerzielle Nutzung. Nur eine freizügige Lizenz (Open Source oder Fully Open) gibt dir grünes Licht, uneingeschränkt kommerziell zu betreiben. Reine Open-Weights-Modelle verbieten womöglich genau die Nutzung, die du vorhast. Lies die Karte.
- Prüfbarkeit und Souveränität. Nur ein Fully-Open-Modell lässt dich die Trainingsdaten inspizieren und den Bau reproduzieren. Für regulierte Käufer, die ihre Systeme erklären müssen, ist das der Unterschied zwischen einer belastbaren Antwort und einem Achselzucken.
- Nutzungsbeschränkungen. Das ist die scharfe Kante. Die Community-Lizenz von Llama 4 verbietet die Nutzung in der EU. Ein Modell kann frei herunterladbar und trotzdem für ein EU-Produkt tabu sein. Genau diese eine Klausel ist der Grund, warum ein EU-souveräner Stack besser zu Modellen greift, deren Lizenz ja sagt: Gemma 4 (Apache-2.0), Qwen, Mistral, OLMo oder EuroLLM.
Eine schnelle Lesehilfe für jede Modellkarte: Open Weights beantwortet „darf ich es laufen lassen?", Open Source beantwortet „darf ich damit verkaufen?", und Fully Open beantwortet „kann ich belegen, was es ist?".
Wo pdf2okf hineinpasst
pdf2okf ist modell-agnostisch: Diese Lizenzstufen wählst du, wir geben sie nicht vor. Das OKF-kompatible Bundle, das pdf2okf baut, ist einfaches Markdown, und die Struktur lebt im Bundle, nicht im Modell. So läufst du die Stufe, die deine Lage verlangt, und tauschst später, ohne dein Wissen anzufassen. Maximale Rechtssicherheit? Nimm ein Apache-2.0-Modell wie Gemma 4. Herkunft gegenüber einem Prüfer belegen? Nimm ein Fully-Open-Modell wie OLMo 3. Für die EU bauen? Meide Llama 4, und du bist sauber.
Zur Auswahl unter den konkreten Kandidaten siehe welches offene Modell für deine Dokumente; zu den Runtimes, die sie bereitstellen, siehe KI lokal betreiben 2026. Besitze ein Modell, dessen Lizenz ja sagt, und niemand kann dir das Recht abschalten, deinen eigenen Stack zu nutzen.