pdf2okf·

Wiki

DSGVO-konforme KI: warum lokale Inferenz das Transferproblem löst

Zwei DSGVO-Probleme, die im Moment des Absendens zünden

Cloud-LLMs sind nützlich, aber bei personenbezogenen Daten lösen sie zwei verschiedene Teile der DSGVO gleichzeitig aus, und die meisten Teams kalkulieren nur mit einem davon.

Problem eins: die Drittlandübermittlung (Kapitel V)

Die meisten Spitzenmodelle werden von US-Unternehmen auf US-kontrollierter Infrastruktur betrieben. Personenbezogene Daten dorthin zu schicken ist eine Übermittlung in ein Drittland nach Kapitel V der DSGVO, die nur unter bestimmten Garantien zulässig ist. Du kannst die Übermittlung mit Standardvertragsklauseln (SCC) absichern oder dich auf das EU-US Data Privacy Framework stützen, doch diese Instrumente beseitigen die zugrunde liegende Aussetzung nicht. Ein US-Anbieter bleibt unter dem US CLOUD Act erreichbar, egal wo er die Daten speichert; das Risiko, gegen das die Garantien wirken sollen, überlebt also die Garantien selbst. Die Übermittlung ist das Problem, und in einem Cloud-LLM ist die Übermittlung unvermeidlich.

Problem zwei: wer ist der Auftragsverarbeiter (Art. 28)

Die DSGVO verteilt Rollen. Du bist der Verantwortliche; ein konformer LLM-Anbieter sollte ein Auftragsverarbeiter sein, der nur auf deine dokumentierten Weisungen hin handelt, gebunden durch einen Auftragsverarbeitungsvertrag nach Artikel 28. Diese Kette hält nur, solange der Anbieter mit deinen Eingaben nichts anderes tut als das Verlangte. Sobald Eingaben weiterverwendet werden (zum Trainieren oder Verbessern eines Modells, zur Qualitätsbewertung, zum Bau von Funktionen), handelt der Anbieter zu eigenen Zwecken und ist für diese Tätigkeit kein bloßer Auftragsverarbeiter mehr. Die saubere Kette vom Verantwortlichen zum Auftragsverarbeiter, auf die die DSGVO baut, bricht leise, oft vergraben in Bedingungen, die kaum jemand liest.

Warum lokale Inferenz beide neutralisiert

Läuft das Modell auf deiner eigenen Hardware, verlieren beide Probleme zugleich ihre Ursache. Das ist der Kern einer KI ohne Cloud:

  • Keine Übermittlung. Verlässt das Dokument die Maschine nie, gibt es kein Drittland, keine Übermittlung nach Kapitel V und nichts, was SCC oder das Data Privacy Framework flicken müssten. Eine KI ohne Datenabfluss beantwortet die Frage nicht. Sie stellt sich gar nicht erst.
  • Kein externer Auftragsverarbeiter. Berührt keine außenstehende Partei die Daten, gibt es keinen Auftragsverarbeiter zu prüfen, keinen Art.-28-Vertrag zu verhandeln und keine Klausel zur Weiterverwendung von Eingaben zu fürchten. Du bleibst von Anfang bis Ende der alleinige Verantwortliche.

Genau dorthin weist die Stellungnahme 28/2024 des EDSA zu KI-Modellen: Die datenschutzrechtliche Prüfung hängt daran, ob personenbezogene Daten tatsächlich verarbeitet und offengelegt werden. Nimm die Offenlegung weg, und du nimmst den größten Teil der Angriffsfläche weg. Das ist der eigentliche Hebel hinter lokalem LLM-Datenschutz: Lokale Inferenz argumentiert nicht an der DSGVO vorbei, sie verändert die Tatsachen, auf die die DSGVO angewendet wird.

Was lokale Inferenz nicht tut

Sei ehrlich über die Grenze, denn Übertreibung ist hier ein eigenes Compliance-Risiko. Inferenz lokal zu halten macht dich nicht „DSGVO-befreit", und es bedeutet nicht, dass die DSGVO „erledigt" ist. Es beseitigt das Übermittlungs- und das Externer-Auftragsverarbeiter-Problem (zwei der härtesten), aber du bleibst der Verantwortliche, und dessen Pflichten verschwinden nicht:

  • Eine Rechtsgrundlage ist weiterhin für alles nötig, was du verarbeitest.
  • Betroffenenrechte (Auskunft, Berichtigung, Löschung) bleiben deine Pflicht.
  • Die Richtigkeit dessen, was das System über reale Personen ausgibt, bleibt deine Verantwortung.
  • Deine eigene Governance (Aufbewahrung, Zugriffskontrolle, Verzeichnisse, Sicherheit des lokalen Systems) bleibt bei dir.

Self-Hosting verwandelt deine Rolle: vom Vertrauen in eine Kette ausländischer Auftragsverarbeiter hin zu einer sauberen, in sich geschlossenen Datenschutz-Geschichte. Das ist eine deutlich stärkere Position. Es sind nicht null Pflichten.

Wo pdf2okf ins Bild kommt

pdf2okf ist darauf ausgelegt, dich bei beiden Problemen standardmäßig auf der richtigen Seite zu halten, eine DSGVO-konforme KI im strukturellen Sinn. Es verwandelt PDFs in OKF-kompatible Wissens-Bundles auf deiner eigenen Hardware oder gegen deinen eigenen Schlüssel. Keine Seite geht an Dritte, also keine Drittlandübermittlung und kein externer Auftragsverarbeiter in der Schleife. Du bleibst der alleinige Verantwortliche, mit einer Datenschutz-Geschichte, die in einem Satz erklärt ist: Die Daten sind nie gegangen. Was das konkret gegen die US-Rechtshoheit bringt, steht in Der CLOUD Act; die größere Einordnung in Datenhoheit für KI.

Quellen

pdf2okf.com

Sei dabei, wenn es aufgeht.

pdf2okf entsteht gerade im Privaten, self-hosted, souverän. Hinterlass eine Mail, du bist als Erstes drin.