pdf2okf·

Wiki

MCP für Dokumente: was es ist und wie OKF hineinpasst

Was MCP tatsächlich ist

MCP, das Model Context Protocol, ist eine Standard-Schnittstelle, über die ein KI-Agent mit Tools und Datenquellen spricht, ohne für jede einzelne eine maßgeschneiderte Integration zu brauchen. Vor einem solchen Standard wurde jede Verbindung von Hand gebaut: dieser Agent an jene Datenbank, jener Agent an diesen Dateispeicher, jeweils mit eigenem Glue-Code, eigener Auth, eigenen Eigenheiten. Die Zahl der Integrationen wuchs mit der Zahl der Agenten mal der Zahl der Tools, und kaum etwas davon war wiederverwendbar.

MCP räumt damit auf. Statt eine Integration pro Paarung zu schreiben, stellt ein Tool oder eine Datenquelle einen einzigen MCP-Server bereit, der das Protokoll spricht. Jeder MCP-fähige Agent (ein Coding-Agent, ein Chat-Client, eine eigene Schleife) kann sich dann mit diesem Server verbinden und nutzen, was er bietet, ohne vorab etwas Tool-Spezifisches zu wissen. Server einmal schreiben; jeder konforme Client kann ihn lesen. Das Protokoll definiert ein kleines, typisiertes Vokabular: Der Server kündigt an, was er kann, der Agent entdeckt es, und Aufrufe laufen über einen einheitlichen Kanal.

Für MCP Dokumente ist das eine attraktive Form. Eine Dokumentquelle kann sich als Server präsentieren, und jeder Agent, der MCP spricht, fragt sie genauso ab wie alles andere.

Wie ein OKF-Bundle ins Bild passt

Ein OKF-Bundle ist bereits der richtige Rohstoff. pdf2okf verwandelt ein PDF in ein Verzeichnis einfacher Markdown-Dateien, eine pro Konzept, plus einen leichtgewichtigen Metadaten-Index. Es ist strukturiert, selbstbeschreibend und liegt im lokalen Dateisystem. Das in einen MCP-Server zu hüllen, passt natürlich: Der Server würde die Konzepte des Bundles als etwas freigeben, das ein Agent über das Protokoll auflisten und lesen kann, statt als rohe Dateien, durch die der Agent selbst navigieren muss.

Der ehrliche Stand: Ein MCP Server PDF von pdf2okf steht auf der Roadmap, ist nicht ausgeliefert. Es ist ein geplanter Baustein, nichts, das du heute installieren kannst. Wenn er kommt, ist die Idee schlicht: Richte einen beliebigen MCP-fähigen Agenten über einen Server-Eintrag auf das Bundle, und er liest die Konzepte nativ, wobei der Dateipfad als Beleg dient und derselbe belegbare Text darunterliegt. Die Schnittstelle wird höherwertig; die Fakten bleiben dieselben einfachen Dateien.

Du musst nicht darauf warten

Hier ist der Teil, den Entwickler oft übersehen: Du brauchst MCP nicht, um ein OKF-Bundle heute aus einem Agenten zu nutzen. Das Bundle besteht nur aus Dateien, und Dateien zu lesen unterstützt jeder shell-fähige Agent bereits.

Die Konvertierung läuft einmal:

pdf2okf convert mein-dokument.pdf --output ./mein-bundle/

Von da an kann jeder Agent, der einen Shell-Befehl ausführt, es abfragen:

grep -ri "Haftungsfreistellung" ./mein-bundle/concepts/

cat ./mein-bundle/concepts/haftungsfreistellung.md

Der Agent bekommt den exakten Text zurück, mit einem Dateipfad, den er zitieren kann. Es gibt keine Retrieval-Schicht, der man vertrauen muss, und keinen Dienst, der laufen muss: Das „Tool" ist das Dateisystem, das jeder Agent ohnehin kennt. Das funktioniert identisch über Hermes Agent, Odysseus, OpenClaw, Claude Code, Cursor, Codex CLI und jede selbst geschriebene Schleife. Siehe Dokumente aus jedem Agenten lesen für das vollständige Muster.

CLI heute, MCP später: dasselbe Bundle

Es hilft, die beiden Wege als Schichten über einem Artefakt zu sehen, nicht als Konkurrenten:

  • Der CLI-/Datei-Weg (jetzt verfügbar): maximale Kompatibilität, keine neuen Abhängigkeiten. Kann ein Agent grep und cat, kann er dein Wissen lesen. Das ist der Boden, und er reicht bereits.
  • Der MCP-Weg (Roadmap): eine typisierte, entdeckbare Schnittstelle für Agenten, die lieber einen Server aufrufen, als in die Shell auszuweichen. Ergonomischer für MCP-native Clients, liest aber dasselbe OKF-Bundle und liefert dieselben belegten Antworten.

Entscheidend: Keiner der Wege verändert die Daten. Das Bundle bleibt so oder so einfaches Markdown, das dir gehört. MCP ist, wenn es kommt, eine schönere Vordertür zu einem Haus, in dem du schon wohnst. Kein neues Haus und kein Lock-in. Zum größeren Integrationsbild siehe OKF-Bundles in agentische Tools integrieren.

Wo pdf2okf ins Bild kommt

pdf2okf erzeugt das Artefakt, von dem beide Wege abhängen: ein portables, OKF-kompatibles Bundle aus einfachen Dateien auf deiner eigenen Maschine. Heute liest du es mit der CLI und gewöhnlichen Dateiwerkzeugen aus jedem Agenten. Morgen lässt ein geplanter MCP-Server MCP-fähige Agenten genau dasselbe Bundle nativ lesen. Du wettest nicht auf ein Protokoll. Dir gehören die Dateien, und die Schnittstellen dürfen sich frei darum herum verbessern. Trag dich auf der Warteliste auf pdf2okf.com ein, um den CLI-Release und den MCP-Server zu verfolgen, sobald er erscheint.

pdf2okf.com

Sei dabei, wenn es aufgeht.

pdf2okf entsteht gerade im Privaten, self-hosted, souverän. Hinterlass eine Mail, du bist als Erstes drin.