pdf2okf·

Glossar

Das Vokabular souveräner Dokumenten-KI.

Kurze, klare Definitionen: jeder Begriff an einem Ort, verlinkt mit dem Wiki.

  • Agentisches Retrieval

    Ein Agent, der Dateien bei Bedarf durchsucht statt einmaliger Vektorsuche.

  • BYOK (Bring Your Own Key)

    Eigenen Modell-API-Schlüssel nutzen: Daten und Abrechnung bleiben auf deinem Konto.

  • CLOUD Act

    Ein US-Gesetz, das auf Daten US-amerikanischer Anbieter zugreift, egal wo sie liegen.

  • Datenhoheit

    Welche Gesetze für deine Daten gelten, nicht nur, wo sie liegen.

  • Datenresidenz

    Wo deine Daten physisch liegen: die schwächste der drei Garantien.

  • Deterministische KI

    Code berechnet exakte Fakten, das Modell berichtet sie nur.

  • Digitale Souveränität

    Kontrolle über den ganzen Stack: Software, Betrieb und Lieferkette.

  • Embedding

    Ein numerischer Vektor für ein Textstück, die Basis der Vektorsuche.

  • EU AI Act (KI-Verordnung)

    Die gestufte KI-Regulierung der EU: Self-Hosting macht dich zum Betreiber, nicht ausgenommen.

  • Frontmatter

    Ein kleiner YAML-Metadatenblock am Anfang einer Markdown-Datei.

  • Inferenz vs. Training

    Training erstellt ein Modell einmal; Inferenz ist sein Betrieb für Antworten.

  • Kontextfenster

    Wie viel Text ein Modell auf einmal berücksichtigen kann, gemessen in Tokens.

  • MCP (Model Context Protocol)

    Eine Standard-Schnittstelle, über die Agenten mit Tools und Datenquellen sprechen.

  • OKFZ

    Das portable, teilbare Wissens-Bundle von pdf2okf.

  • On-Device-KI / lokale KI

    Inferenz auf der eigenen Maschine: Daten verlassen sie nie.

  • Open Knowledge Format (OKF)

    Googles anbieterneutraler Standard: KI-Wissen als Markdown + YAML-Frontmatter.

  • Open Weights

    Herunterladbare Modellgewichte zum Selbstbetrieb, nicht immer Open Source.

  • Quantisierung

    Ein Modell verkleinern, indem man seine Gewichte mit geringerer Präzision speichert.

  • RAG (Retrieval-Augmented Generation)

    Einem Modell abgerufene Dokumentpassagen geben, um Antworten zu erden.

  • Vektordatenbank

    Ein Embedding-Index für klassisches RAG, den pdf2okf nicht braucht.