pdf2okf·

Wiki

Eine selbst-gehostete Alternative zu NotebookLM

NotebookLM ist wirklich gut, und genau das ist das Problem

Googles NotebookLM gehört zu den ehrlicheren KI-Tools der letzten Jahre. Es bleibt bei den hochgeladenen Dokumenten, liefert Zitate und vermeidet das selbstsichere Halluzinieren, das die meisten allgemeinen KI-Chatbots für ernsthaften Einsatz unbrauchbar macht. Wer eine Sammlung von Forschungsarbeiten oder Produkthandbüchern einspielt, erlebt zitierte Antworten, die wirklich beeindrucken.

Das Problem steckt im Wort hochgeladen. Jedes Dokument, das du NotebookLM übergibst, wandert auf Googles Server und wird Teil einer Abfrage-und-Antwort-Pipeline, die du nicht kontrollierst. Für ein Kochrezept oder ein öffentliches Whitepaper ist das in Ordnung. Für einen Vertragsentwurf, eine Patientenzusammenfassung, ein Vorstandsprotokoll oder alles, das Vertraulichkeitspflichten unterliegt, scheidet das Hochladen auf einen externen Dienst aus, egal wie gut das Produkt ist.

Was deine Dokumente preisgeben, wenn sie das Haus verlassen

Das Risiko ist nicht abstrakt. Wer ein vertrauliches PDF an einen Cloud-Dienst schickt, übergibt es einem Auftragsverarbeiter zu Bedingungen, die die wenigsten wirklich gelesen haben. Für Rechtsanwälte und andere Berufsgeheimnisträger in Deutschland kann die Weitergabe von Mandantendokumenten an ein Cloud-LLM mit den Pflichten aus §203 StGB kollidieren. Für Gesundheitseinrichtungen in der EU unterliegen Patientendaten den besonderen Schutzpflichten aus Art. 9 DSGVO. Diese lösen sich nicht auf, weil der Zielserver als KI-Produkt vermarktet wird. Und für jedes Unternehmen mit Geschäftsgeheimnissen stellt sich nach dem Upload die Frage, wie geheim diese noch sind.

NotebookLMs Datenschutzdokumentation erklärt, dass Dokumente nur für die Sitzung genutzt werden und Google seinen Standard-Auftragsverarbeitungsbedingungen folgt. Das ist eine Richtlinien-Zusage, keine architektonische Garantie. Richtlinien ändern sich, Bedingungen werden aktualisiert, und sie gelten nur, solange der Anbieter sie einhalten will. NotebookLM Datenschutz ist damit ein genuines Anliegen, kein theoretisches.

Der selbst-gehostete Weg: OKF auf deiner Hardware

Dieselbe Kernfähigkeit, die NotebookLM bietet (belegte Antworten aus dem Dokumentenbestand, keine Halluzinationen jenseits der bereitgestellten Texte), lässt sich auf Hardware reproduzieren, die du kontrollierst. Der Schlüssel ist das Format, in dem das Wissen lebt.

pdf2okf wandelt deine PDFs in OKF-kompatible Wissens-Bundles um, gemäß dem Open Knowledge Format, das Google selbst im Juni 2026 veröffentlicht hat. Ein OKF-Bundle ist strukturiertes Markdown: Jedes Dokument wird zu einer Sammlung von Textabschnitten mit Frontmatter, das Quelle, Abschnitt und Seitenreferenz bewahrt. Dieses Bundle liegt auf deiner Festplatte, in deinem Netzwerk, unter deiner Kontrolle. Kein Teil davon wurde irgendwohin geschickt.

Von dort liest dein eigenes Modell (lokal betrieben über Ollama, llama.cpp, oMLX oder einen anderen OpenAI-kompatiblen Server) das Bundle und beantwortet Fragen genau so, wie NotebookLM es täte, nur dass das Modell ebenfalls auf deiner Hardware läuft und die Antwort niemals eine Cloud-API berührt. Zitate kommen aus dem Frontmatter des Bundles: Das Modell referenziert die Originalquelle und den Abschnitt, keine halluzinierte Beschreibung.

NotebookLM lokal vs. Cloud: der direkte Vergleich

| | NotebookLM | pdf2okf (selbst-gehostet) | |---|---|---| | Wo läuft es | Googles Cloud | Deine Hardware | | Wer sieht deine Dokumente | Google (nach deren Bedingungen) | Nur du | | Format, das dir gehört | Googles interne Darstellung | OKF-Bundle: offener Standard, reines Markdown | | Offline nutzbar | Nein | Ja, mit lokalem Modell | | Zitierte Antworten | Ja | Ja, aus Bundle-Frontmatter | | Vertrauliche Dokumente | Erfordert Upload auf Google-Server | Keine Übermittlung, kein externer Verarbeiter |

Ein fairer Blick auf NotebookLM

NotebookLM kann Dinge, die pdf2okf noch nicht kann. Es hat eine ausgereifte Browser-Oberfläche, Audio-Zusammenfassungen, Notebook-Freigabe und Jahre Google-Engineering im Rücken. Die Frage ist nicht, welches Tool im Abstrakten besser ist. Die Frage ist, welches Tool dir überhaupt zur Verfügung steht, wenn die Dokumente das Gebäude nicht verlassen dürfen.

Für öffentliche Forschung, veröffentlichte Whitepapers oder alles, wo ein Cloud-Upload wirklich unproblematisch ist, ist NotebookLM ausgezeichnet. Die selbst-gehostete Alternative zählt genau dort, wo das nicht gilt: Verträge, klinische Notizen, interne Finanzmodelle oder alles, das Berufsgeheimnisregeln unterliegt. Das ist keine Nische. Es ist der größte Teil der Arbeit, die in regulierten Branchen wirklich zählt.

Wie es weitergeht

pdf2okf ist für den Fall gebaut, in dem das Hochladen schlicht keine Option ist. Es verwandelt PDFs in OKF-Bundles auf deiner eigenen Maschine, arbeitet mit jedem lokalen Modell oder deinem eigenen API-Schlüssel zusammen und liefert zitierte Antworten, ohne dass irgendwelche Daten deine Kontrolle verlassen. Das Produkt ist in der privaten Build-Phase: trag dich in die Warteliste ein und bekomm frühen Zugang, um das Format mit deinen eigenen Dokumenten auszuprobieren.

Die Qualität zitierter Antworten, die NotebookLM überzeugend macht, setzt keine Cloud voraus. Sie setzt ein strukturiertes Format voraus. Dafür ist OKF da.

pdf2okf.com

Sei dabei, wenn es aufgeht.

pdf2okf entsteht gerade im Privaten, self-hosted, souverän. Hinterlass eine Mail, du bist als Erstes drin.