Häufig gestellte Fragen

Inhaltsübersicht

    nach oben

    Was ist Diffix?

    Diffix ist eine Zusammenstellung von Mechanismen zur Anonymisierung strukturierter Daten. Es wurde gemeinsam entwickelt von Aircloak GmbH und dem Max-Planck-Institut für Softwaresysteme entwickelt. Diffix' nutzt Mechanismen, die von den nationalen Statistikämtern seit Jahrzehnten verwendet werden: Aggregation, Generalisierung, Rauschen, Unterdrückung und Vertauschung. Es wendet diese Mechanismen bei Bedarf automatisch auf jede einzelne Abfrage an, um das Rauschen zu minimieren und gleichzeitig eine hohe Anonymität zu gewährleisten. Hier finden Sie einen kurzen Überblick.

    nach oben

    Was ist Open Diffix?

    Open Diffix ist ein Projekt, das die Diffix-Anonymisierung frei und offen machen soll. Im Rahmen des Open Diffix-Projekts werden zwei Diffix-Abfrage-Engine-Implementierungen entwickelt, eine auf der Grundlage von .NET und die andere als PostgreSQL-Erweiterung. Diffix für Desktop ist eine GUI-basierte Anwendung auf der .NET-Abfrage-Engine. Diffix for Desktop zielt auf eine einfache Bedienung ab, während Diffix for PostgreSQL auf eine höhere Komplexität und Skalierung abzielt. Beide sind stark anonym und erfüllen die GDPR-Definition von Anonymität.

    nach oben

    Was ist Diffix Fir?

    Die Hauptversionen von Diffix sind nach Bäumen benannt. Diffix Aspen bis Dogwood wurden von der Aircloak GmbH entwickelt. Diffix Elm war die erste Version, die im Rahmen des Open Diffix-Projekts entwickelt wurde. Im Vergleich zu früheren Versionen stellte Diffix Elm eine Art "Komplexitäts-Reset" dar. Es ist viel einfacher zu bedienen und leichter zu analysieren (wenn auch weniger funktionsreich).

    Die neueste Version ist Diffix Fir, die mehrere neue Funktionen wie Summe, Durchschnitt und WHERE enthält.

    nach oben

    Wo kann ich mich über Diffix Fir informieren?

    Eine vollständige Spezifikation und Datenschutzanalyse von Diffix Fir ist noch nicht abgeschlossen. Die vollständige Spezifikation und die Analyse der Privatsphäre von Diffix Elm ist auf ArXiv verfügbar. Sie enthält eine Anleitung zur Erstellung einer Risikobewertung. Da Fir nur ein paar neue Funktionen zu Elm hinzufügt, reicht die Elm-Spezifikation für den Moment.

    Einen guten Überblick über Diffix Elm finden Sie hier hier , wobei die zusätzlichen Funktionen von Diffix Fir beschrieben werden hier.

    nach oben

    Wie wird Diffix Fir eingesetzt?

    Open Diffix unterstützt zwei Implementierungen von Diffix Fir, eine PostgreSQL-Erweiterung (pg_diffix) und eine eigenständige Desktop-Anwendung.

    Diffix for PostgreSQL bietet alle Vorteile von PostgreSQL und ermöglicht die Entwicklung von skalierbaren Web-Backends, Dashboards und Anwendungen über eine Standard-API mit SQL sowie die Verwendung von SQL-Clients.

    Diffix für Desktop basiert auf einer .NET-Implementierung von Diffix Fir. Es wurde für eine extrem einfache Installation und Nutzung ausgelegt. Es unterstützt CSV-Tabellen und bietet eine einfache GUI (keine SQL -Kenntnisse erforderlich).

    nach oben

    Wie schneidet Diffix im Vergleich zu Differential Privacy und k-anonymity ab?

    K-Anonymität verwendet Generalisierung und Unterdrückung. Systeme, die auf Differential Privacy (differentielle Privatsphäre) basieren, verwenden Rauschen und verwenden oft Verallgemeinerung. Diffix verwendet alle drei und kombiniert so die Vorteile von K-Anonymität und Differential Privacy, ohne sich formal an eines der beiden Modelle zu halten. Dabei orientiert sich Diffix eher wie nationale Statistikämter die Anonymisierung angehen. Diffix bietet zwar nicht die mathematischen Garantien von Low-Epsilon Differential Privacy bietet, aber es ergeben sich hinsichtlich der Privatsphäre keine Nachteile.

    nach oben

    Welche Arten von Analysen werden von Diffix Fir unterstützt (und nicht unterstützt)?

    Diffix unterstützt deskriptive Analysen über strukturierte Daten wie relationale Datenbanken oder CSV-Dateien: Auswahl von Spalten, Abfrage von Zählungen oder Summen über diese Spalten, Einordnung von Daten in Klassen unterschiedlicher Größe usw. Deskriptive Analysen werden verwendet, um Visualisierungen wie Balkendiagramme, Streudiagramme oder Heatmaps zu erstellen. Diffix unterstützt kein maschinelles Lernen, keine Generierung synthetischer Daten, keine Datenmaskierung, keine Pseudonymisierung, kein Image Fuzzing und keine Anonymisierung von Freiformtext (Redacting).

    nach oben

    Wie viel SQL wird von Diffix Fir unterstützt?

    Diffix Elm unterstützt eine sehr begrenzte, aber nützliche Teilmenge von SQL. Damit können Sie mehrspaltige Histogramme erstellen von Zählungen, Summen und Durchschnittswerten erstellen. Es unterstützt grundlegende Verallgemeinerungsfunktionen (z. B. Rundung numerischer Spalten und Teilstring-Auswahl von Textspalten). Es unterstützt WHERE mit AND-Logik.

    nach oben

    Was ist, wenn ich mehr SQL-Funktionen möchte?

    Open Diffix arbeitet ständig an der Entwicklung neuer SQL-Funktionen. Die nächste geplante Version von Diffix (Greenheart) wird JOIN und native Zeitstempel-Datentypen unterstützen. Wenn Sie zusätzliche Funktionen für Ihren Anwendungsfall benötigen, kontaktieren Sie uns unter hello@open-diffix.org.

    nach oben

    Wie steht es um die Datenqualität?

    Alle Anonymisierungsmechanismen verringern die Datenqualität, indem sie verallgemeinern oder verzerren, und Diffix bildet da keine Ausnahme. Die Datenqualität von Diffix ist vergleichbar mit den von vielen nationalen Statistikämtern veröffentlichten Daten (z. B. Volkszählungsdaten) und übertrifft in der Regel bei weitem die Qualität von k-Anonymität und Differential Privacy.

    Diffix für Desktop zeigt das Ausmaß der Verzerrung an, sowohl als zusammenfassende Statistik als auch durch die Originaldaten und die anonymisierten Daten nebeneinander anzeigt. Auf diese Weise können Sie die Datenqualität von Diffix selbst festlegen. Diffix für PostgreSQL kann das Ausmaß des Rauschens anzeigen, das zu jeder Ausgabe-Klasse hinzugefügt wurde.

    nach oben

    Wie sieht das Vertrauensmodell für Nutzer/Analysten aus?

    Diffix verfügt über zwei Betriebsmodi, den vertrauenswürdigen Analystenmodus und den nicht-vertrauenswürdigen Analystenmodus. Der vertrauenswürdige Modus schützt vor einer versehentlichen Freigabe personenbezogener Daten. Der nicht-vertrauenswürdige Modus schützt vor der absichtlichen, böswilligen Offenlegung personenbezogener Daten. Ein Analyst im vertrauenswürdigen Modus benötigt keine Fachkenntnisse in der Anonymisierung, um über Diffix abgefragte Daten sicher freizugeben.

    nach oben

    Warum sollte ich nicht immer den nicht-vertrauenswürdigen Modus verwenden?

    Der vertrauenswürdige Modus ist einfacher zu verwenden. Er bietet mehr Abfragefunktionen und in Diffix for Desktop kann ein Analyst die anonymisierten Daten und die Originaldaten nebeneinander vergleichen. Auf diese Weise weiß der Analytiker genau, wie stark die Daten durch Unterdrückung und Rauschen verzerrt sind, und er kann die Spaltenauswahl und Verallgemeinerung nach Bedarf anpassen.

    nach oben

    Ist Open Diffix GDPR (DSGVO)-konform?

    Die kurze Antwort lautet "Ja". Die längere Antwort lautet, dass es keine konkreten Kriterien für die GDPR-konformen Anonymität gibt. Letztendlich obliegt es dem Datenschutzbeauftragten oder der Datenschutzbehörde, die Entscheidung zu treffen. Diffix, wie es von Aircloak implementiert wurde, wurde fast immer als GDPR-anonym bewertet, und das Gleiche gilt für Open Diffix.

    nach oben

    Kann uns das Open Diffix-Projekt bei der Einhaltung der GDPR (DSGVO) helfen?

    Die vollständige Spezifikation von Diffix Elmist zur Unterstützung der Risikobewertung durch Datenschutzbeauftragten und Datenschutzbehörden für GDPR oder andere Datenschutzstandards gedacht. Sie beschreibt die Anonymisierungsmechanismen im Detail und enthält eine Analyse der Anonymisierungseigenschaften gegenüber einer umfassenden Reihe von Angriffen. Für Unterstützung in diesem Prozess können Sie uns unter hello@open-diffix.org kontaktieren.

    nach oben

    Ist Open Diffix Open Source?

    Fast. Open Diffix arbeitet unter der Business Source License (BSL1.1). Unsere Lizenz macht Diffix frei für alle Anwendungsfälle, einschließlich kommerzieller, die Diffix-Software oder Schnittstellen nicht weiterverkaufen.

    nach oben

    Wie wird Open Diffix finanziert?

    In den ersten Jahren wird Open Diffix vom Max-Planck-Institut für Softwaresysteme als Forschungsinitiative finanziert. Unser Ziel ist es, durch Sponsoring, Beratung oder Lizenzierung uns künftig selbst zu finanzieren. Lizenzierung.

    nach oben

    Ich habe weitere Fragen. An wen kann ich mich wenden?

    Bitte kontaktieren Sie uns unter hello@open-diffix.org