2026-06-12
Google veröffentlicht das Open Knowledge Format (OKF)

Ein Standard für Wissen, der keine Datenbank ist
Am 12. Juni 2026 hat Google Cloud das Open Knowledge Format (OKF) v0.1 veröffentlicht, eine anbieterneutrale Spezifikation dafür, wie das Wissen dargestellt wird, das eine KI oder ein Agent liest. Die radikalste Designentscheidung ist zugleich die schlichteste: Es sind einfach Dateien. Markdown-Dokumente mit YAML-Frontmatter. Kein proprietäres Konto, kein SDK, kein verwalteter Dienst, den du aufrufen musst, um deine eigenen Daten zu verstehen.
Wir sagen schon eine Weile, dass das die richtige Form für KI-Wissen ist. Es ist gut, wenn ein veröffentlichter Standard dasselbe sagt.
Was OKF tatsächlich ist
OKF stellt Wissen als reine Markdown-Dateien plus strukturiertes Frontmatter dar. Das klingt bescheiden. Genau das ist der Punkt:
- Portabel: kopiere den Ordner, und er funktioniert überall. Kein Export-Job, keine Anbieter-Migration.
- Versionierbar: es lebt in Git. Du kannst es diffen, reviewen, zurückrollen.
- Anbieterneutral: kein Konto, kein SDK, keine Laufzeitumgebung, die leben muss, damit die Daten lesbar bleiben. Ein Mensch öffnet es im Texteditor und liest es.
Vergleiche das mit der üblichen Art, wie Teams Dokumente an eine KI verfüttern: das PDF in Chunks zerlegen, die Chunks einbetten, in eine Vektordatenbank laden und diese Datenbank dann mitliefern, samt Hosting, Re-Embedding-Rechnungen und Lock-in. Das Wissen landet eingesperrt in der Infrastruktur. OKF setzt auf das Gegenteil: das Wissen sind die Dateien. Wer einen Ordner lesen kann, kann seine Wissensbasis lesen. Wer einen Ordner kopieren kann, kann sie bewegen. Das ist gelebte Datenhoheit.
Zur Klarstellung: OKF ist Googles Standard
Wir haben OKF nicht erfunden und behaupten das auch nicht. Google Cloud hat es veröffentlicht, und das ist gut so: eine veröffentlichte, anbieterneutrale Spezifikation ist für das gesamte Feld mehr wert als das Hausformat irgendeines einzelnen Produkts. Was pdf2okf tut, ist, sie zu erzeugen.
Zeig pdf2okf auf ein PDF, und es baut ein OKF-kompatibles Bundle aus kleinen, verlinkten Konzeptdateien: Text, Tabellen und Diagramme werden zu expliziter, durchsuchbarer Struktur. Der Standard bestätigt das Format; pdf2okf ist der souveräne, selbstgehostete Weg, deine Dokumente hineinzubringen, ohne eine einzige Seite irgendwohin hochzuladen. Die Umwandlung passiert auf deiner Hardware oder gegen deinen eigenen Schlüssel. Kompatibilität mit dem Standard ist das Ziel; die Hoheit über den Prozess ist der Unterschied.
Wo OKFZ ins Spiel kommt
Unser eigentliches Unterscheidungsmerkmal liegt einen Schritt jenseits des Dateiformats. Ein OKFZ-Bundle ist das portable Format zum Teilen: einmal aus dem Quell-PDF gebaut, dann das Bundle selbst weitergegeben.
Das verändert die Ökonomie des Wissenteilens mit einer KI. Die Empfängerseite verarbeitet das Ausgangsdokument nicht erneut. Sie stellt keine Vektordatenbank auf. Sie bettet nichts neu ein und zahlt nicht noch einmal fürs Indizieren. Das Wissen reist als ein einziges, in sich geschlossenes Artefakt: versionierbar, diffbar und lesbereit in dem Moment, in dem es ankommt. Einmal bauen, das Bundle teilen, fertig. Keine erneute Verarbeitung, keine Vektordatenbank zum Mitschicken, keine Indizierungsrechnung pro Empfänger.
So wird aus „teile deine Dokumente mit einer KI" ein echter Arbeitsablauf statt einer Pflichtübung. Ein Vertrag, ein Handbuch, ein Forschungskorpus: einmal als .okfz verpackt, einer Kollegin, einem Kunden oder einem anderen Agenten in die Hand gegeben, und es funktioniert. Der Standard verleiht dem Format Legitimität; OKFZ verleiht ihm Beine.
Das ist das zweite Ding, das es zu besitzen lohnt. Ein Modell, das du selbst betreibst (Gemma 4), heißt: niemand kann deine Intelligenz abschalten. Ein portables Format, das dir gehört (OKF / OKFZ), heißt: niemand kann dein Wissen einsperren. Und den Stack nicht zu mieten (Fable 5) heißt: niemand kann deiner Kontinuität den Stecker ziehen. pdf2okf ist um alle drei zugleich gebaut: besitze dein Modell, besitze dein Format, besitze deinen Stack.