Dokumente aus jedem Agenten lesen: CLI & MCP

Jeder Agent, der Shell-Befehle ausführen kann, liest deine Dokumente

Die meisten Dokumenten-KI-Tools sind Silos. Du lädst ein PDF in einen Cloud-Dienst hoch, der Dienst zerlegt es in einen proprietären Vektorspeicher und du fragst über die API dieses Dienstes ab, oder gar nicht. Du kannst deinen eigenen lokalen KI-Agenten nicht auf diese Chunks zeigen. Du kannst keine Abfragen offline durchführen. Du kannst nicht nachvollziehen, was die Retrieval-Schicht gesehen hat, bevor sie geantwortet hat.

pdf2okf bricht dieses Muster. Das CLI-Dokumenten-Tool wandelt ein PDF in ein OKF-kompatibles Bundle um: ein Verzeichnis einfacher Markdown-Dateien, eine pro Konzept, plus einen leichtgewichtigen Metadaten-Index. Einfache Dateien auf deinem lokalen Dateisystem. Und einfache Dateien kann jeder Agent, der jemals existiert hat, bereits lesen.

Einmal konvertieren, dauerhaft abfragen

Der Konvertierungsschritt läuft einmalig:

pdf2okf convert mein-dokument.pdf --output ./mein-bundle/

Das Ergebnis ist ein Verzeichnis mit .md-Dateien. Nichts Proprietäres. Keine Datenbank. Kein Dienst, der dauerhaft laufen muss.

Von diesem Punkt an kann jeder Agent oder jedes CLI-Tool, das grep oder Dateien lesen kann, dein Wissen abfragen:

grep -r "Haftungsklausel" ./mein-bundle/concepts/

cat ./mein-bundle/concepts/haftungsklausel.md

Ein lokaler KI-Agent, der diese Befehle ausführt, erhält den exakten Text zurück, mit einem Dateipfad, der gleichzeitig als Quellenangabe dient. Die Antwort ist belegt und nachvollziehbar. Es gibt kein Halluzinationsrisiko auf der Retrieval-Ebene, weil es keine Retrieval-Ebene gibt. Nur Dateien.

Wie eine Agenten-Schleife das Bundle nutzt

Das typische Muster mit einem autonomen Agenten sieht so aus:

Der Agent empfängt eine Frage.
Er führt grep -ri "Stichwort" ./mein-bundle/concepts/ aus, um relevante Konzeptdateien zu finden.
Er liest diese Dateien mit cat oder einem Datei-Lese-Tool.
Er verfasst eine Antwort und zitiert die Dateinamen als Quellen.

Jeder Schritt läuft lokal. Kein API-Aufruf verlässt deinen Rechner, es sei denn, du routest explizit zu einem Remote-Modell, was deine Entscheidung ist.

Dieses Muster funktioniert identisch bei allen Agenten, die Shell-Befehle unterstützen: Hermes Agent, Odysseus, OpenClaw, Claude Code, Cursor, Codex CLI und jede eigene Agenten-Schleife, die du selbst schreibst. Das OKF-Bundle ist für jeden Agenten lesbar: ein universelles CLI-Dokumenten-Interface ohne Anpassungsaufwand.

Kein Plugin, kein SDK, kein Lock-in

Geschlossene Cloud-Dokumentenassistenten haben eine andere Architektur. Dein PDF geht an deren Server. Deren proprietäre Embeddings indizieren es. Deren API liefert Antworten. Wenn du dieses Wissen von einem anderen Tool aus abfragen möchtest, geht das nicht. Die Chunks liegen in deren Vektorspeicher, hinter deren Authentifizierung.

Mit pdf2okf liegt das Wissen in einem Verzeichnis, das dir gehört. Du kannst es kopieren, mit git versionieren, als .okfz-Archiv weitergeben oder in das Arbeitsverzeichnis eines beliebigen Agenten verlinken. Das Tool, das das Bundle erstellt hat, und das Tool, das es liest, sind vollständig entkoppelt.

Das bedeutet auch, dass der Agent Dateien offline liest. Ein lokaler KI-Agent auf einem Laptop ohne Internetverbindung kann das Bundle trotzdem abfragen. Das ist wichtig in Air-Gap-Umgebungen, auf Reisen und überall dort, wo Bandbreite begrenzt ist oder sensible Daten das Gebäude nicht verlassen dürfen.

Der MCP-Pfad (auf der Roadmap)

MCP (Model Context Protocol) ist ein aufkommender Standard, um Agenten über eine typisierte Server-Schnittstelle statt über rohe Dateilese-Vorgänge mit Datenquellen zu verbinden. pdf2okf hat einen MCP-Server auf seiner Roadmap.

Wenn dieser verfügbar ist, können Agenten, die MCP nativ unterstützen, darunter Claude Code und Cursor, per Server-Konfigurationseintrag auf ein OKF-Bundle zeigen und es ohne Shell-Befehle abfragen. Die zugrundeliegenden Fakten sind dieselben einfachen Dateien; die Schnittstelle ist höherstufig.

Bis dahin ist der Shell-Befehlspfad vollständig funktionsfähig und erfordert nichts weiter als das, was jeder Agent bereits unterstützt.

Was Cloud-Dokumenten-KI nicht kann

Cloud-Dokumentenassistenten sind für den Gelegenheitsgebrauch praktisch. Sie sind keine Lösung, wenn:

Dokumente personenbezogene Daten, Krankenakten, Rechtsberatung oder Geschäftsgeheimnisse enthalten, die dein Netzwerk nicht verlassen dürfen.
Deine Abfragen auditierbar sein müssen: Du musst wissen, welcher Text genau die Basis der Antwort war.
Du in einem regulierten Umfeld arbeitest, in dem DSGVO, § 203 StGB oder ärztliche Schweigepflicht die Verarbeitung durch Drittanbieter einschränken.
Du dasselbe Wissen von mehreren Agenten und Workflows aus zugänglich machen willst, ohne es erneut hochzuladen.

pdf2okf ist genau für diese Anforderungen gebaut. Das Bundle ist dein lokaler KI-Agent für Dokumente, in deinem Dateisystem, lesbar von jedem Tool deiner Wahl. Das ist die Grundlage einer souveränen Dokumenten-Pipeline, und sie beginnt mit einem einzigen CLI-Befehl.

Jetzt loslegen

Konvertiere ein PDF, prüfe die Ausgabe, und führe eine einfache grep-Abfrage im Konzept-Verzeichnis durch. Sieh, was ein Agent leisten kann, wenn die Retrieval-Schicht aus Dateien besteht. Trage dich in die Warteliste auf pdf2okf.com ein, um benachrichtigt zu werden, sobald das CLI verfügbar ist.