Anwendbarkeit von Anonymisierungstechniken im Bereich Big Data

Von Andreas Bender, April 2015

Home / Über uns / inovex Lab / Anwendbarkeit von Anonymisierungstechniken im Bereich Big Data

Datenschutz und Datensicherheit erfordern einen sorgfältigen Umgang mit personenbezogenen Daten. Ein populärer Ansatz basiert auf der Anonymisierung dieser Daten.

In seiner Masterthesis untersucht inovexler Andreas Bender, inwieweit bekannte Anonymisierungsverfahren auf große Datenmengen in Big-Data-Systemen angewendet werden können.

Anonymisierung ist eine Methode, um personenbezogene Daten so zu verändern, dass keine Rückschlüsse mehr auf einzelne Personen gezogen werden können. Dennoch können, mit Hilfe von Datenanalysen, wertvolle Informationen aus den anonymisierten Daten gewonnen werden.

Die Arbeit bietet eine umfangreiche Übersicht zu Anonymisierungsmethoden bzw. -algorithmen, bei der Vor- und Nachteile verschiedener Ansätze aufgezeigt werden. Das Hauptaugenmerk liegt hierbei auf der Bewertung von Algorithmen hinsichtlich ihrer Effizienz und Skalierbarkeit.

Auf Grundlage der gesammelten Erkenntnisse wurde ein neuer paralleler Anonymisierungsalgorithmus entwickelt und mit aktuellen Big Data-Technologien (Apache Hadoop, Apache Spark) implementiert. Damit können große personenbezogene Datenmengen in einem Big-Data-System effizient anonymisiert werden.

Inhalt:

Grundlagen

Struktur von Mikrodaten
Anonymisierung und verwandte Themengebiete: z. B. Pseudonymisierung, Verschlüsselung
Beispiele unzureichender Anonymisierung

Analyse

Kategorisierung von Bedrohungen: Identity Disclosure, Attribute Disclosure u. a.
Kriterien für Anonymität: k-Anonymity, l-Diversity, d-Presence u. a.
Anonymisierungsoperationen: Generalisierung, Permutation, Slicing u. a.
Untersuchung von Algorithmen: Mondrian/Rothko, Anatomize, Hilb u. a.

Open-Source-Implementierungen

Frei verfügbare Implementierungen von Algorithmen: UTD Anonymization Toolbox u. a.
Tools zur Anonymisierung von Mikrodaten: ARX Anonymization Tool, Cornell Anonymization Toolkit u. a.

Konzeption und Implementierung eines verteilten Algorithmus

Entwurf eines neuen parallelen Algorithmus zur Anonymisierung von Mikrodaten
Implementierung auf Basis von Apache Hadoop und Apache Spark

Evaluierung

Datensätze: Zensusdaten, generierte Testdaten
Testcluster auf Amazon Elastic MapReduce (Amazon EMR)
Evaluierung der Effizienz und Skalierbarkeit
Vergleich mit anderen Verfahren

Anwendbarkeit von Anonymisierungstechniken im Bereich Big Data pdf, 1.68 MB

Haben Sie Fragen?

Christian Meder

Chief Technology Officer

Anrufen E-Mail senden

Name	Borlabs Cookie
Anbieter	Eigentümer dieser Website
Zweck	Speichert die Einstellungen der Besucher, die in der Cookie Box von Borlabs Cookie ausgewählt wurden.
Cookie Name	borlabs-cookie
Cookie Laufzeit	1 Jahr

Akzeptieren
Name	Google Analytics
Anbieter	Google LLC
Zweck	Cookie von Google für Website-Analysen. Erzeugt statistische Daten darüber, wie der Besucher die Website nutzt.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de
Cookie Name	_ga,_gat,_gid
Cookie Laufzeit	2 Jahre

Akzeptieren
Name	Hotjar
Anbieter	Hotjar Ltd.
Zweck	Hotjar ist ein Analysewerkzeug für das Benutzerverhalten von Hotjar Ltd. Wir verwenden Hotjar, um zu verstehen, wie Benutzer mit unserer Website interagieren.
Datenschutzerklärung	https://www.hotjar.com/legal/policies/privacy/
Host(s)	*.hotjar.com
Cookie Name	_hjClosedSurveyInvites, _hjDonePolls, _hjMinimizedPolls, _hjDoneTestersWidgets, _hjIncludedInSample, _hjShownFeedbackMessage, _hjid, _hjRecordingLastActivity, hjTLDTest, _hjUserAttributesHash, _hjCachedUserAttributes, _hjLocalStorageTest, _hjptid
Cookie Laufzeit	Sitzung / 1 Jahr

Akzeptieren
Name	HubSpot
Anbieter	HubSpot Inc.
Zweck	HubSpot ist ein Verwaltungsdienst für Benutzerdatenbanken bereitgestellt von HubSpot, Inc. Wir nutzen HubSpot auf dieser Website für unsere Online Marketing-Aktivitäten.
Datenschutzerklärung	https://legal.hubspot.com/privacy-policy
Host(s)	*.hubspot.com, hubspot-avatars.s3.amazonaws.com, hubspot-realtime.ably.io, hubspot-rest.ably.io, js.hs-scripts.com
Cookie Name	__hs_opt_out, __hs_d_not_track, hs_ab_test, hs-messages-is-open, hs-messages-hide-welcome-message, __hstc, hubspotutk, __hssc, __hssrc, messagesUtk
Cookie Laufzeit	Sitzung / 30 Minuten / 1 Tag / 1 Jahr / 13 Monate

Akzeptieren
Name	Leadfeeder
Anbieter	Dealfront Group GmbH

Akzeptieren
Name	OpenStreetMap
Anbieter	OpenStreetMap Foundation
Zweck	Wird verwendet, um OpenStreetMap-Inhalte zu entsperren.
Datenschutzerklärung	https://wiki.osmfoundation.org/wiki/Privacy_Policy
Host(s)	.openstreetmap.org
Cookie Name	_osm_location, _osm_session, _osm_totp_token, _osm_welcome, _pk_id., _pk_ref., _pk_ses., qos_token
Cookie Laufzeit	1-10 Jahre

Akzeptieren
Name	Podigee
Anbieter	Podigee
Zweck	Wird verwendet, um Podigee-Inhalte automatisch zu entsperren.
Datenschutzerklärung	https://www.podigee.com/de/ueber-uns/datenschutz
Host(s)	podigee., podigee.com, podigee.io