"Anonyme" Daten Schützen Ihre Identität Nicht
"Anonyme" Daten Schützen Ihre Identität Nicht

Video: "Anonyme" Daten Schützen Ihre Identität Nicht

Отличия серверных жестких дисков от десктопных
Video: Anonym im Internet surfen! Datenschutz ist jedem Unternehmen egal! 2023, Februar
Anonim

Eine neue Studie zeigt, dass es überraschend einfach ist, eine Person innerhalb eines vermeintlich inkognito-Datensatzes zu identifizieren.

Bild
Bild

Die Welt produziert ungefähr 2,5 Billionen Bytes digitaler Daten pro Tag und fügt so ein Meer von Informationen hinzu, die vertrauliche Details über die Gesundheit und Gewohnheiten vieler Menschen enthalten. Zum Schutz der Privatsphäre müssen Datenbroker solche Aufzeichnungen anonymisieren, bevor sie sie an Forscher und Vermarkter weitergeben. Eine neue Studie hat jedoch festgestellt, dass es relativ einfach ist, eine Person aus einem vermeintlich anonymisierten Datensatz erneut zu identifizieren - selbst wenn dieser Satz unvollständig ist.

Massive Datenrepositorys können Trends aufdecken, die medizinische Forscher über Krankheiten informieren, Themen wie die Auswirkungen von Einkommensunterschieden aufzeigen, künstliche Intelligenz in menschliches Verhalten umwandeln und natürlich Werbung effizienter anstreben. Um Personen zu schützen, die witzig oder nicht personenbezogene Daten in diese digitalen Lagerhäuser einbringen, senden die meisten Makler ihre Daten durch einen Prozess der Deidentifizierung. Bei diesem Verfahren werden offensichtliche Markierungen, einschließlich Namen und Sozialversicherungsnummern, entfernt und manchmal andere Vorsichtsmaßnahmen getroffen, z. B. zufällige „Rauschdaten“in die Sammlung aufgenommen oder bestimmte Details durch allgemeine ersetzt (z. B. das Geburtsdatum „7. März“vertauscht), 1990 “für„ Januar - April 1990 “). Die Broker geben dann einen Teil dieser Informationen frei oder verkaufen sie.

„Bei der Anonymisierung von Daten verwenden wir Daten seit 25 Jahren zu statistischen Zwecken und zu Forschungszwecken, während die Privatsphäre der Menschen gewahrt bleibt“, sagt Yves-Alexandre de Montjoye, Assistenzprofessor für Datenschutz am Imperial College London und Co-Mitarbeiter Autor der neuen Studie, die diese Woche in Nature Communications veröffentlicht wurde. Viele häufig verwendete Anonymisierungstechniken wurden jedoch in den 1990er Jahren entwickelt, bevor die rasante Entwicklung des Internets es ermöglichte, so viele Details über Dinge wie die Gesundheit, die Finanzen sowie die Einkaufs- und Surfgewohnheiten eines Einzelnen zu sammeln. Diese Diskrepanz hat es relativ einfach gemacht, eine anonyme Datenzeile mit einer bestimmten Person zu verbinden: Wenn ein Privatdetektiv in New York nach jemandem sucht und weiß, dass das Subjekt männlich ist, 30 bis 35 Jahre alt ist und an Diabetes leidet, ist dies die Wahrheit wäre nicht in der Lage, den Namen des Mannes abzuleiten - könnte dies aber wahrscheinlich recht einfach tun, wenn er oder sie auch den Geburtstag des Ziels, die Anzahl der Kinder, die Postleitzahl, den Arbeitgeber und das Automodell kennt.

In den letzten Jahren haben Montjoye und andere Forscher Studien veröffentlicht, in denen Personen anhand von Sets wie anonymisierten Einkaufsdaten oder Gesundheitsakten erneut identifiziert wurden. Einige behaupten, dass das Risiko einer erneuten Identifizierung relativ gering ist, da diese Gruppen häufig nur einen Bruchteil der Bevölkerung widerspiegeln - was zu der Unsicherheit führt, dass eine bestimmte Person in die Liste aufgenommen wird. Die neue Studie entwickelte jedoch ein statistisches Modell, um die Möglichkeit zu berechnen, dass jede Eingabe namenloser Daten mit ihrer wahren Identität in Verbindung gebracht werden kann. Die Untersuchung ergab, dass dies störend einfach ist, selbst wenn mit einem unvollständigen Datensatz gearbeitet wird.

"Wenn Sie in den USA durchschnittlich 15 Merkmale (einschließlich Alter, Geschlecht oder Familienstand) haben, reicht dies aus, um die Amerikaner in 99,98 Prozent der Fälle in einem anonymisierten Datensatz erneut zu identifizieren", sagt Montjoye. Obwohl 15 demografische Informationen viel klingen mögen, bedeutet dies einen Tropfen auf den heißen Stein in Bezug auf das, was wirklich da draußen ist: 2017 landete ein Marketing-Analyse-Unternehmen in heißem Wasser, weil es versehentlich einen anonymisierten Datensatz veröffentlicht hatte, der 248 Attribute für enthielt jeder von 123 Millionen amerikanischen Haushalten.

Wie hoch ist das Risiko für Ihre persönlichen Daten? Für die neue Studie hat das Forschungsteam ein digitales Tool erstellt, mit dem einzelne Internetnutzer sehen können, wie wahrscheinlich es ist, dass sie aus einem anonymen Info-Dump erneut identifiziert werden. Laut diesem Tool besteht für den durchschnittlichen Benutzer ein 83-prozentiges Risiko einer erneuten Identifizierung. Und man hat wenig Rückgriff, wenn es darum geht, die Informationssammlung abzulehnen. "Ein paranoider Verbraucher könnte aufhören, irgendetwas online zu veröffentlichen, das Internet nicht mehr zu nutzen, keine Apps mehr zu verwenden, die Nutzung von Mobiltelefonen aufzugeben und keine Kreditkarten mehr zu verwenden - aber das ist heutzutage wirklich nicht praktikabel", sagt Jennifer Cutler, Associate Professor für Marketing an der Kellogg School of Management der Northwestern University, der nicht an der neuen Studie beteiligt war. „Unser heutiges Leben ist größtenteils online und es müssen immer Kompromisse geschlossen werden. Es gibt einen Grund, warum die politischen Entscheidungsträger den Datenaustausch nicht vollständig eingeschränkt und eingeschränkt haben. Und das liegt daran, dass der Datenaustausch und diese Modelle sehr gut genutzt werden können. “

Anstatt die Datenerfassung insgesamt zu verbieten, schlägt Montjoye vor, dass Datenbroker neue Anonymisierungstechniken entwickeln und diese rigoros testen müssen, um sicherzustellen, dass Dritte Personen nicht anhand persönlicher Statistiken identifizieren können. "Das Problem liegt hauptsächlich in der aktuellen Praxis der Anonymisierung", sagt er. "Im Moment sehen wir nur die Spitze des Eisbergs, aber es ist besorgniserregend, dass das Ziel, eine erneute Identifizierung zu verhindern, nicht erreicht wird." Die Standards müssen höher sein und die Praktiken müssen überprüft werden. “

Aufgrund des geringen Rückgriffs von Einzelpersonen glauben einige, dass das Halten von Datenbrokern auf einem höheren Standard möglicherweise neue Rechtsvorschriften erfordert. „Da es anonym ist, müssen Datensammler die betroffenen Personen nicht um ihre Zustimmung bitten, sodass Sie nicht wissen, ob Ihre Daten gesammelt und an Dritte weitergegeben werden“, sagt der Co-Autor der Studie, Luc Rocher, Ph.D.. Kandidat an der Katholischen Universität von Louvain in Belgien. "Ich denke, hier geht es eher um die Verantwortung der Vorschriften, unsere persönlichen Daten besser zu schützen."

Cutler stimmt zu, dass forschungsgestützte Gesetze notwendig sein werden. „Interdisziplinäre Forscher und politische Entscheidungsträger müssen wirklich weiterarbeiten, wie in diesem Papier beschrieben“, um evidenzbasierte Vorschriften zu schaffen, „damit wir das gesündeste Gleichgewicht zwischen Innovation und Fortschritt erreichen und gleichzeitig die Benutzer schützen können so viel wie wir können.".

Beliebt nach Thema