Glossar
Das Vokabular souveräner Dokumenten-KI.
Kurze, klare Definitionen: jeder Begriff an einem Ort, verlinkt mit dem Wiki.
- Agentisches Retrieval
Ein Agent, der Dateien bei Bedarf durchsucht statt einmaliger Vektorsuche.
- BYOK (Bring Your Own Key)
Eigenen Modell-API-Schlüssel nutzen: Daten und Abrechnung bleiben auf deinem Konto.
- CLOUD Act
Ein US-Gesetz, das auf Daten US-amerikanischer Anbieter zugreift, egal wo sie liegen.
- Datenhoheit
Welche Gesetze für deine Daten gelten, nicht nur, wo sie liegen.
- Datenresidenz
Wo deine Daten physisch liegen: die schwächste der drei Garantien.
- Deterministische KI
Code berechnet exakte Fakten, das Modell berichtet sie nur.
- Digitale Souveränität
Kontrolle über den ganzen Stack: Software, Betrieb und Lieferkette.
- Embedding
Ein numerischer Vektor für ein Textstück, die Basis der Vektorsuche.
- EU AI Act (KI-Verordnung)
Die gestufte KI-Regulierung der EU: Self-Hosting macht dich zum Betreiber, nicht ausgenommen.
- Frontmatter
Ein kleiner YAML-Metadatenblock am Anfang einer Markdown-Datei.
- Inferenz vs. Training
Training erstellt ein Modell einmal; Inferenz ist sein Betrieb für Antworten.
- Kontextfenster
Wie viel Text ein Modell auf einmal berücksichtigen kann, gemessen in Tokens.
- MCP (Model Context Protocol)
Eine Standard-Schnittstelle, über die Agenten mit Tools und Datenquellen sprechen.
- OKFZ
Das portable, teilbare Wissens-Bundle von pdf2okf.
- On-Device-KI / lokale KI
Inferenz auf der eigenen Maschine: Daten verlassen sie nie.
- Open Knowledge Format (OKF)
Googles anbieterneutraler Standard: KI-Wissen als Markdown + YAML-Frontmatter.
- Open Weights
Herunterladbare Modellgewichte zum Selbstbetrieb, nicht immer Open Source.
- Quantisierung
Ein Modell verkleinern, indem man seine Gewichte mit geringerer Präzision speichert.
- RAG (Retrieval-Augmented Generation)
Einem Modell abgerufene Dokumentpassagen geben, um Antworten zu erden.
- Vektordatenbank
Ein Embedding-Index für klassisches RAG, den pdf2okf nicht braucht.