Adzine Top-Stories per Newsletter
DATA

What the heck is … Data-Hashing?

Richard Ofenböck, 1. Februar 2017
dollarphotoclub.com / Adobe Stock juergen faelchle

Ad Verification, Adstitching, Deal-ID's, Header-Bidding, Prospecting oder Viewability … das ist nur eine kleine Auswahl englischsprachiger Fachbegriffe ohne die es in der digitalen Werbung und im Marketing nicht mehr geht. Deutsche Übersetzungen greifen hier oftmals zu kurz oder wollen einfach nicht so richtig passen. Damit unsere Leser im Fachjargon-Dickicht den Durchblick behalten, erklären Adtech-Insider die wichtigsten Fachbegriffe. Von Marketing Profis für Marketing Profis.

Je stärker Werbung personalisiert und individualisiert wird, desto wichtiger wird Datenschutz. Dabei ist das Bewusstsein für den Schutz personenbezogener Daten im europäischen Raum – und vor allem in Deutschland – deutlich größer als beispielsweise in den USA. Dies hängt zum einen mit der im Vergleich weniger restriktiven Gesetzgebung in den Vereinigten Staaten zusammen, zum anderen mit der aktuellen Entwicklung auf EU-Ebene, beispielsweise mit der kommenden Europäischen Datenschutzgrundverordnung.

Auch am Werbemarkt rückt das Thema Datenschutz immer weiter in das Bewusstsein der Öffentlichkeit, vor allem durch die wachsende Automatisierung, die Technologien wie beispielsweise Programmatic Advertising schaffen. Eine Möglichkeit, Daten zu schützen, ist das sogenannte „Hashing“. Dies ist ein technisches Verfahren, mit dem sich die Daten der Nutzer anonymisiert nutzbar machen lassen. Aber was genau ist darunter zu verstehen?

Anonym und doch bekannt

Hashing ist eine Technologie, die ursprünglich aus dem klassischen Datenbankbereich kommt und persönliche Daten wie z. B. Passwörter, Namen etc. in eine bestimmte Zeichenfolge transformiert. Der sogenannte „Hash-Key“ wird dabei auf Grundlage mathematischer Verschlüsselungsfunktionen generiert und lässt sich nicht mehr rückentschlüsseln (Einwegfunktion). Es wird stets derselbe Hashwert für einen bestimmten Datensatz generiert.

Das folgende Szenario zeigt, wie man sich die Technologie in der Praxis vorstellen kann. Ein Online-Shop ist mit einer Kundendatenbank (CRM) verknüpft, über die die Kundeninformationen für Retargeting genutzt werden sollen. Nun stellt sich die Frage, wie man diese Offline-Daten anonym in die entsprechende DSP, DMP oder den Adserver importieren kann? Der Online-Shop und die jeweilige Technologie speichern jeweils getrennt User-IDs in eigenen Cookies. Um beide Datenbanken abgleichen zu können, muss ein Mapping auf ein bestimmtes Attribut erfolgen, dies kann beispielsweise die E-Mail-Adresse des Users sein. Damit die E-Mail-Adresse (Personal Identifier) nicht im Klartext im System (DSP, DMP oder Adserver) gespeichert wird, wird sie „gehashed“ übergeben. Die Übergabe erfolgt z. B. im Login-Bereich des Online-Shops. Im jeweiligen System wird dann eine Mappingtabelle erstellt, in der die Verbindung von User-ID zur gehashten E-Mail-Adresse gespeichert wird.

Mappingtabelle

Beispiel einer Mappingtabelle

Sobald im Adserver diese Mappingtabelle vorhanden ist, können weitere Attribute (sogenannte „non personal identifier“) wie z. B. Geschlecht importiert werden – auch von verschiedenen Datenquellen, aber nur sofern die E-Mail-Adresse der User bekannt ist. Gematcht wird dann über die gehashte E-Mail-Adresse.

Importbeispiel

Im Programmatic Advertising werden so alle personenbezogenen Daten – also beispielsweise Name oder E-Mail-Adresse – der Nutzer verschlüsselt. Anstatt der Speicherung von persönlichen Daten werden die Hashes der Daten abgelegt. Durch Hashing ist es möglich, dass persönliche Daten zu den Vorlieben und Gewohnheiten der Nutzer für ein noch zielgenaueres und individuelleres Targeting genutzt werden, ohne dass die tatsächliche Identität dieser Nutzer im Klartext erscheint. Jeder User ist also nur durch einen generierten „Schlüssel“ zu identifizieren, die Person, die dahintersteht, ist niemandem bekannt. So wird die Privatsphäre der User geschützt und gleichzeitig verhindern die Adserver-Anbieter, dass personenbezogene Daten in die falschen Hände geraten. Hashing ist also ein idealer Weg, Anonymität und nutzbare Userdaten zu verbinden und den Anforderungen des Datenschutzes gerecht zu werden.

Bild Richard Ofenböck / adverserve Über den Autor/die Autorin:

Richard Ofenböck ist seit Gründung 2001 in der Funktion als CTO für adverserve tätig und verantwortet das Ad Management sowie die Weiterentwicklung des technischen Produktportfolios. Von Beginn an prägte er das Zukunftsbild und den Unternehmensfokus hinsichtlich Ad Technologies maßgeblich. In seiner derzeitigen Tätigkeit als CTO fungiert er als direkter Ansprechpartner für alle technologischen Partner in den Bereichen Adserving, Programmatic Advertising sowie Data Management. Darüber hinaus verantwortet er bereichsübergreifend die Verifizierung neuer Ad-Technologien, die strategische Kundenberatung und das technische Projektmanagement. Zwei seiner wichtigsten Aufgaben sind, die Innovationsdynamik des Unternehmens weiter zu erhöhen sowie die technologische Vision des Unternehmens voranzutreiben.