Metadaten

Was anonymisierte Datensätze über einzelne Menschen verraten

Metadaten wirken vergleichsweise harmlos, weil sie keine persönlichen Angaben enthalten. Aber es ist relativ einfach, einen Datensatz einem bestimmten Menschen zuzuordnen. Forscher fordern nun eine Neuregelung des Datenschutzes.
Von Marie-Anne Winter mit Material von dpa

Metadaten verraten viel über Menschen. Metadaten verraten viel über Menschen.
Bild: dpa
Beim Internetsurfen oder beim Einkaufen fallen sie hundertfach an: Metadaten. Sie wirken auf den ersten Blick vergleichsweise harmlos und keinesfalls so privat wie persönliche Informationen, etwa der eigene Name oder die Adresse. Doch dieser Eindruck täuscht.

Einzelne Menschen können mitunter mit wenig Aufwand aus großen, anonymisierten Datensätzen herausgepickt werden. Das fanden Forscher am US-amerikanischen Massachusetts Institute of Technology (MIT) und der dänischen Universität Aarhus heraus. Sie untersuchten einen Satz Kreditkartendaten von 1,1 Millionen Menschen. Metadaten verraten viel über Menschen. Metadaten verraten viel über Menschen.
Bild: dpa
Die Daten enthielten weder Namen noch Kontonummern, sondern lediglich Tag, Ort und Höhe der Zahlungen, die von einem bestimmten Konto getätigt worden waren.

Dennoch konnten die Forscher einen einzelnen Menschen mit hoher Wahrscheinlichkeit in dem Datensatz wiederfinden. Dazu mussten sie lediglich vier Bezahlvorgänge von ihm kennen und mit dem Datensatz abgleichen. Solche privaten Infos können etwa aus einem öffentlichen Tweet oder einer Bewertung im Internet abgeleitet werden.

"Wir wissen, was du gestern getan hast"

Wussten die Forscher auf diese Weise, dass eine Person am Montag einen Kaffee mit der Kreditkarte bezahlt, am Dienstag im Supermarkt eingekauft hatte, am Donnerstag in einem Sportartikelgeschäft und am Freitag in einem Kleidungsladen war, konnten sie diese Person in 90 Prozent der Fälle in dem Datensatz wiederfinden. Für die Wissenschaftler zeigen die Ergebnisse, dass auch große Datensätze häufig keine umfassende Anonymität bieten.

Es handelt sich keineswegs um die erste Studie dieser Art. Bereits Anfang 2014 legten Studenten der Universität Stanford ähnliche Ergebnisse vor: Sie hatten mit Hilfe einer App für Android-Smartphones herausgefunden, dass Metadaten tatsächlich extrem sensibel sind. Sie entwickelten die Metaphone-App, die Studien-Teilnehmer auf ihrem Smartphone installierten. Die App erfasste Metadaten (Telefonnummer der Anrufenden und Angerufenen, Zeitpunkt und Länge des Gesprächs) und übermittelte sie mit dem Einverständnis der Teilnehmer an die Forscher.

Schon die erste Auswertungen der Metaphone-Studie zeigten, wie weit Metadaten reichen: Die 546 Studienteilnehmer wählten insgesamt 33 688 unterschiedliche Telefonnummern an. Bei 18 Prozent der angerufenen Nummern konnten die Studenten durch die Suche im sozialen Netzwerk wie Yelp und über Google Places die dazugehörigen Identitäten ermitteln.

Trotz einer relativ geringen Anzahl von Teilnehmern und einem kurzen Erhebungszeitraum hat diese Studie gezeigt, dass gerade Telefon-Metadaten sehr sensible Daten sind. Die Studenten Jonathan Mayer und Patrick Mutchler waren in der Lage, anhand der Daten, die ihre App Metaphone erfasst hat, Informationen über Krankheiten, Suchtprobleme, die finanzielle Situation, den Besitz von Waffen und vieles mehr herauszufinden.

Ein Datensatz ohne Namen ist keineswegs anonym

Auch beim Surfen im Internet, beim Benutzen von öffentlichen Verkehrsmitteln oder beim Streamen von Musik oder Filmen über Online-Dienste fallen massenhaft Daten an, die gesammelt und analysiert werden. Es sei wahrscheinlich, dass auch diese Daten trotz Anonymisierung einfach wieder einzelnen Personen zugeordnet werden könnten, schreiben die Forscher im Fachmagazin Science.

"Nur weil ein Datensatz keine Namen, Adressen, Telefonnummern oder andere offensichtliche Merkmale enthält (...) macht ihn das nicht anonym." Das erfordere eine neue Diskussion über Datenschutz. Denn personenbezogene Daten sind zwar geschützt, anonymisierte Datensätze aber nicht. "Unsere Ergebnisse zeigen, dass eine Reform unseres Datenschutzes nötig ist, die über personenbezogene Daten hinaus geht."

Mehr zum Thema Überwachung