pdf2okf·

Wiki

On-Premise vs. "deutsche Cloud": EU-gehostet ist nicht On-Device

Drei Begriffe, die ähnlich klingen und sehr Verschiedenes meinen

Datenresidenz", „Datenhoheit" und „digitale Souveränität" werden in Verkaufsdecks, Ausschreibungsbögen und politischen Reden austauschbar benutzt. Sie sind nicht dasselbe, und genau diese Verwechslung sorgt dafür, dass man eine „souveräne Cloud" kauft und am Ende schwächeren Datenschutz hat als erwartet.

Datenresidenz ist eine Frage des Ortes: Deine Daten werden innerhalb einer definierten geografischen Grenze gespeichert und verarbeitet, etwa Deutschland oder die EU. Es ist eine Tatsachenaussage darüber, wo der Server steht. Sie sagt nichts darüber, wer diesen Server kontrolliert oder welcher Rechtsordnung der Betreiber unterliegt.

Datenhoheit geht weiter: Die Kontrolle über die Daten folgt der Jurisdiktion des Dateneigentümers, nicht nur dem Standort des Servers. Echte Hoheit heißt, dass die für die Daten geltenden Gesetze deine sind und nicht die, die sich der Anbieter aussucht.

Digitale Souveränität ist ein politisches Konzept: die Fähigkeit einer Region, eines Staates oder einer Organisation, kritische digitale Infrastruktur unabhängig von ausländischen Anbietern, ausländischem Kapital und ausländischem Recht zu betreiben.

Die vermarktete „deutsche Cloud" (deutsches Rechenzentrum, deutsche Gesellschaft, deutsch klingendes Marketing) liefert in der Regel Residenz, nähert sich manchmal der Hoheit an und verfehlt die digitale Souveränität fast per Definition, weil sie weiterhin fremde Software in großem Maßstab betreibt.

Was EU-Hosting wirklich verbessert

Wenn du einen deutschen oder EU-gehosteten Cloud-KI-Dienst wählst, wird einiges tatsächlich besser:

  • Deine Daten überqueren standardmäßig weniger Rechtsgrenzen.
  • EU-Recht regelt den Dienstvertrag unmittelbarer.
  • Manche Angriffsflächen (innereuropäische Datenflüsse, regionale Zuständigkeit bei Verbraucherstreitigkeiten) sind sauberer.

Das ist nicht trivial. Residenz zählt. Sie ist etwas wert. Aber „EU-gehostet" ist nicht dasselbe wie „On-Device" oder „On-Premise", und die Lücke ist keine Spitzfindigkeit.

Ein EU-gehosteter Dienst beinhaltet weiterhin einen Auftragsverarbeiter, der zwischen dir und deinen Daten sitzt. Dieser Auftragsverarbeiter hat Administratoren, Logging-Infrastruktur, Incident-Response-Prozesse und einen Betreiber, der dem Recht seines Sitzes unterliegt. Ist dieser Betreiber eine Tochter eines US-Konzerns (oder stützt er sich auf Software-Infrastruktur US-amerikanischen Ursprungs), wirft der US CLOUD Act einen Schatten, ganz gleich, wo das Rechenzentrum steht.

Der CLOUD Act erlaubt US-Behörden, US-kontrollierte Unternehmen zur Herausgabe von Daten zu zwingen, wo immer sie gespeichert sind. „Der Server steht in Frankfurt" ist keine Verteidigung gegen eine solche Anordnung. Das ist nicht hypothetisch: Der CLOUD Act war genau der Mechanismus, der europäische Datenschutzbehörden nach Schrems II (EuGH, 2020) dazu brachte, die Angemessenheit US-basierter Cloud-Anbieter selbst dann infrage zu stellen, wenn diese EU-Rechenzentren betrieben.

Was On-Premise tatsächlich beseitigt

Betreibe Modell und Daten auf Hardware, die du besitzt und betreibst (ob ein Server in der eigenen Einrichtung, ein Rack in einem von dir kontrollierten Colocation-Standort oder eine Workstation mit Apple Silicon), und der Auftragsverarbeiter verschwindet komplett. Es gibt keinen Dritten. Es gibt keinen Auftragsverarbeitungsvertrag zu verhandeln. Es gibt keinen Betreiber, der einer ausländischen Gerichtsanordnung unterliegt. Die Daten gehören dir, die Rechenleistung gehört dir, und die rechtliche Angriffsfläche bestimmt deine eigene Jurisdiktion und deine eigene Governance.

Das ist ein strukturell anderes Versprechen als „EU-gehostet". Es ist nicht besseres Marketing für dieselbe Sache. Es ist eine andere Architektur, die eine andere Klasse von Garantie erzeugt.

Der Kompromiss ist real: Du betreibst die Hardware. Du wartest sie. Du kümmerst dich um Updates, Kapazität und Sicherheit. Das ist ein echter Betriebsaufwand. Doch für Organisationen, die vertrauliche Mandantendaten, regulierte Akten oder etwas mit grenzüberschreitenden Übermittlungsbeschränkungen verarbeiten, ist dieser Aufwand oft der richtige Tausch, zumal fähige kleine Modelle den Rechenbedarf auf bescheidener Hardware beherrschbar machen.

Die zwei Fragen, die sie trennen

Bei der Bewertung eines „souveränen" KI-Angebots schneiden zwei Fragen durch das Marketing:

  1. Wer betreibt die Infrastruktur? Lautet die Antwort: irgendein außerhalb der EU eingetragenes Unternehmen oder ein EU-Unternehmen mit mehrheitlich außereuropäischer Muttergesellschaft, dann überlebt die CLOUD-Act-Exponierung das EU-Rechenzentrum.
  2. Gibt es überhaupt einen Auftragsverarbeiter? On-Premise und On-Device beantworten das, indem sie den Auftragsverarbeiter aus dem Bild nehmen. EU-Hosting beantwortet es, indem es einen anderen Auftragsverarbeiter wählt: nützlich, aber nicht gleichwertig.

Wo pdf2okf hineinpasst

pdf2okf ist für das On-Premise- und On-Device-Ende des Spektrums gebaut. Es wandelt PDFs auf deiner Maschine in OKF-kompatible Wissens-Bundles um (nach Googles Open Knowledge Format) und diese Bundles werden dann von einem Modell gelesen, das du ebenfalls lokal betreibst. Nichts in dieser Pipeline berührt eine Cloud-API, es sei denn, du fügst für schweres Reasoning bewusst eine hinzu, und selbst dann ist das Dokument bereits strukturiert: Du kannst einen präzisen, belegten Auszug senden, nicht die rohe Datei.

Die in diesem Artikel gezogene Unterscheidung (Residenz, Hoheit, On-Device) bildet genau die Garantie ab, die pdf2okf machen soll. Nicht „deine Daten bleiben in der EU". Nicht „wir sind ein konformer Auftragsverarbeiter". Sondern „deine Daten haben deine Maschine nie verlassen". Das ist eine andere Kategorie von Aussage: die, die hält, wenn die anderen unter einer Gerichtsanordnung oder einem Datenleck geprüft werden.

pdf2okf ist im privaten Aufbau: trag dich in die Warteliste ein, wenn du souveräne Dokumenten-KI für einen regulierten Kontext prüfst oder On-Premise-Ansätze vergleichst.

pdf2okf.com

Sei dabei, wenn es aufgeht.

pdf2okf entsteht gerade im Privaten, self-hosted, souverän. Hinterlass eine Mail, du bist als Erstes drin.