Diffix ausprobieren

Inhaltsübersicht

    nach oben

    Einführung

    Es gibt mehrere Möglichkeiten, mit Diffix zu experimentieren, ohne sich die Mühe zu machen, PostgreSQL einzurichten und die Erweiterung pg_diffix zu installieren. In erster Linie betreibt das Open Diffix Projekt einen PostgreSQL Server mit pg_diffix und mehreren repräsentativen Datenbanken. Es gibt mehrere Möglichkeiten, mit unserem PostgreSQL-Dienst zu interagieren. Alternativ können Sie Diffix Dashboards herunterladen und testen es mit den von uns bereitgestellten CSV-Beispieldatensätzen oder mit Ihrem eigenen CSV-Datensatz.

    Schreiben Sie uns (hello@open-diffix.org) wenn Sie Fragen oder Kommentare haben.

    nach oben

    Dokumentation

    Wie man Diffix verwendet

    Wie man Diffix konfiguriert

    Wie Diffix funktioniert

    nach oben

    Server und Datenbaken

    Die folgenden Datenbanken mit pg_diffix sind online verfügbar:

    Datenbanken mit trusted_user- und untrusted_user-Benutzern werden mit Diffix geschützt (der Modus untrusted_user hat etwas stärkere Anonymität auf Kosten von weniger flexiblem SQL). Datenbanken mit direct_user-Benutzern haben keine Schutzmaßnahmen und können zum Vergleich der Rohdaten mit den geschützten Daten von Diffix verwendet werden.

    Die Datenbanken enthalten die folgenden Tabellen und Daten:

    nach oben

    Online Training App

    Der einfachste und beste Weg, um ein schnelles Gefühl für die Funktionsweise von Diffix zu bekommen, ist die Online-Schulungs-App.

    Die Trainings-App enthält Beispiele für jede der Diffix-Abfragefunktionen. Sie zeigt anonymisierte und Originaldaten nebeneinander an, um zu verdeutlichen, wie Diffix Daten verzerrt und verschleihert. Mit der Trainings-App können Sie auch Ihre eigenen SQL-Abfragen für die Diffix- und Originaldaten schreiben.

    Die Schulungs-App hat Verbindungen zu den Datenbanken banking0, taxi, census0 und scihub. Es dauert nur wenige Minuten, um die grundlegenden Abfragefunktionen von Diffix zu verstehen und etwa 30 Minuten, um jedes Beispiel durchzugehen.

    nach oben

    SQL-Clients

    Im Prinzip sollte jeder SQL-Client, der PostgreSQL unterstützt, mit pg_diffix funktionieren. In der Praxis hat jeder SQL-Client seine eigenen Eigenheiten, wie er die Datenbank erkundet, und daher funktionieren nicht alle SQL-Clients mit pg_diffix.

    Wir haben mit pg_diffix erfolgreich zwei SQL-Clients eingesetzt: pgAdmin und DBeaver

    nach oben

    Software-APIs und Notebooks

    Jede Software mit einer PostgreSQL-Schnittstelle kann mit pg_diffix arbeiten. Wir haben ein Demo-Notebook vorbereitet (hier erhalten Sie weitere Angaben und Details) unter Verwendung von psycopg2 und ipython-sql, das Sie als Vorlage für die Erstellung Ihres eigenen Notebooks verwenden können.

    nach oben

    Diffix Dashboards

    Wenn Sie mit Ihren eigenen Daten experimentieren möchten, können Sie schnell und einfach mit Diffix Dashboards (Download) loslegen. Diffix Dashboards ist eine eigenständige Anwendung für Windows, die mit einer lokalen CSV-Datei arbeitet.

    Diffix Dashboards bündelt das Business Intelligence-Tool Metabase mit pg_diffix. Es erfordert kein SQL, sondern kann mit einem einfachen GUI-Abfragegenerator verwendet werden. Es unterstützt auch das Schreiben von Abfragen in SQL. Wenn Sie keine eigenen Daten haben, mit denen Sie experimentieren können, bieten wir Ihnen eine Reihe von CSV-Beispieldatensätzen zum Herunterladen an.

    nach oben

    Metabase

    Metabase ist ein beliebtes Open-Source Business Intelligence Tool zur Datenvisualisierung. Es verwendet SQL für den Datenzugriff und arbeitet mit einer Vielzahl von Backend-Datenbanktechnologien wie PostgreSQL und pg_diffix. Metabase unterstützt Datenvisualisierung und Dashboards.

    Wir betreiben einen Metabase-Server, der sich mit der Moers-Datenbank verbindet. Die Anmeldedaten sind:

    Die Metabase bietet zwei Möglichkeiten zum Schreiben von Abfragen: über einen GUI-Query-Builder und mit SQL. Der Query-Builder setzt die Auswahl des Benutzers in SQL um. Da Diffix eine eingeschränkte Teilmenge von SQL verwendet, funktioniert nicht der gesamte Query-Builder mit dem pg_diffix-Backend. In der Praxis sollte der Benutzer erwarten, dass er SQL-Abfragen schreibt, wenn er Metabase mit Diffix verwendet.

    Wir haben eine kurze Anleitung geschrieben , wie man das macht vorbereitet.

    nach oben

    Ein visueller Vergleich

    Wir haben eine Diffix-Demo in Form einer Heatmap-Visualisierung von Taxidaten aus New York erstellt. (Sie können eine Beschreibung hier erhalten). Diese Demo zeigt die mit Diffix erstellte Heatmap Seite an Seite mit der entsprechenden Heatmap, die aus den Rohdaten erstellt wurde. Sie vermittelt einen konkreten Eindruck von der Leistungsfähigkeit und Genauigkeit der Diffix-Anonymisierung.