Wiki
OKFZ: das portable, teilbare Wissens-Bundle
Was ein OKFZ ist
Ein OKFZ ist das portable, teilbare Bundle, das pdf2okf aus deinem PDF baut. Im Inneren ist es genau das, was der Standard beschreibt. Es ist ein Satz OKF-kompatibler Konzeptdateien: kleine, verlinkte Markdown-Dokumente mit YAML-Frontmatter, in denen Text, Tabellen und Diagramme des Originals in explizite, durchsuchbare Struktur überführt wurden. Der Unterschied: Ein OKFZ ist verpackt. Die gesamte Wissensbasis (Konzeptdateien, Frontmatter, der index.md-Einstiegspunkt, die Beziehungen zwischen den Teilen) reist als ein einziges, in sich geschlossenes Artefakt, das du jemandem in die Hand drücken kannst.
Stell dir das Format als Grammatik vor und das OKFZ als den fertigen, versiegelten Umschlag. Das OKF sagt, wie eine einzelne Wissensdatei aussieht. Ein OKFZ ist das, was herauskommt, sobald pdf2okf ein ganzes PDF gelesen und das Ergebnis transportfertig verpackt hat.
Einmal bauen, beliebig teilen
Genau dieser Ablauf macht es zum Differenzierer. Du lässt pdf2okf einmal über ein PDF laufen: auf deiner eigenen Hardware oder gegen deinen eigenen Schlüssel, ohne dass eine Seite dein Gerät verlässt. Dieser eine Build erzeugt das OKFZ. Von da an ist das Bundle einfach etwas, das du besitzt:
- Versionieren. Wie jedes andere Artefakt in Git committen, diffen, Wissensstände taggen.
- Bewegen. Auf eine andere Maschine kopieren, in den Objektspeicher legen, an ein Ticket hängen.
- Teilen. Einem Kollegen, einem Kunden oder einem anderen Agenten geben.
Und der entscheidende Punkt: Keine dieser Aktionen verarbeitet das Quell-PDF erneut. Der teure Schritt (das Dokument lesen, Struktur extrahieren, die Konzeptdateien schreiben) ist genau einmal passiert, beim Bau des Bundles. Ein OKFZ zu teilen startet das nicht neu. Der Empfänger braucht weder das Original-PDF noch pdf2okf zum Parsen und stellt keinerlei Infrastruktur auf, um das Erhaltene zu lesen. Einmal bauen, Bundle teilen, fertig.
Warum das besser ist, als eine Vektordatenbank zu verschicken
Vergleiche das damit, wie Wissen heute üblicherweise mit einer KI geteilt wird. Der klassische RAG-Weg lautet: Dokument zerstückeln, Chunks einbetten, in eine Vektordatenbank laden, und wenn ein Kollege dasselbe haben soll, diese Datenbank gleich mitliefern. Das ist aus handfesten Gründen schlechter Ballast:
- Nicht portabel. Ein Vektorindex ist an das Embedding-Modell gebunden, das ihn erzeugt hat, und an die Laufzeit, die ihn ausliefert. Wer die Vektoren weitergibt, gibt eine Abhängigkeit weiter, kein Dokument.
- Nicht menschenlesbar. Öffne den Index, und du siehst Zahlen. Es gibt nichts, was ein Mensch prüfen, korrigieren oder auch nur plausibilisieren könnte.
- Meist neu einbetten. Anderes Modell, andere Version oder anderer Anbieter auf der Gegenseite: das Wissen muss neu aufgebaut werden, bevor es wieder nutzbar ist.
- Hosting im Schlepptau. Irgendetwas muss laufen, damit die Daten überhaupt abfragbar sind.
Ein OKFZ ist in jedem Punkt das Gegenteil. Es ist portabel, weil es Dateien sind. Es ist menschenlesbar, weil es Markdown ist. Der Empfänger kann es öffnen, lesen, sogar im Texteditor bearbeiten. Es gibt nichts neu einzubetten, weil im Bundle keine Embeddings stecken; die Struktur ist der Text. Und es gibt keinen Vektordatenbank-Ballast zu verschicken, weil das Wissen nie darin gefangen war. Einen Vektorindex hostet man. Ein OKFZ besitzt man.
Dir gehört das Bundle
Diese Eigentümerschaft ist der rote Faden. Ein OKFZ ist kein Fenster in einen Dienst, den du mietest; es ist ein Artefakt, das auf deiner Festplatte liegt und niemandem Rechenschaft schuldet. Kein Konto muss aktuell bleiben, damit es lesbar bleibt. Keine Anbieter-Laufzeit muss am Leben sein, damit es etwas bedeutet. Würde die Firma hinter dem Werkzeug morgen verschwinden, ließe sich dein OKFZ weiterhin öffnen, lesen und nutzen, denn es ist nichts als OKF-kompatibles Markdown in einer Hülle, und das portable Format ist ein veröffentlichter, anbieterneutraler Standard, kein privater Trick.
Das meinen wir mit dem eigenen Format. Ein Modell, das du selbst betreibst, bedeutet, dass niemand deine Intelligenz abschalten kann. Ein Format, das dir gehört, bedeutet, dass niemand dein Wissen wegsperren kann, und ein OKFZ ist genau dieses Prinzip, gegossen in eine Datei, die du verschicken kannst. Der Standard, das OKF, gibt dem Format seine Legitimität; das teilbare Bundle gibt ihm Beine.
Genau dafür gibt es pdf2okf. PDF rein, portables, teilbares, OKF-kompatibles Bundle zurück, das wirklich dir gehört: ohne Cloud-Umweg, ohne Vektordatenbank und ohne erneute Verarbeitung an dem Tag, an dem du es weitergeben willst.