PII Check: Warum du deine Analytics Daten verlieren könntest (und was du dagegen tun kannst)16 min Lesezeit

Michaela Linhart 14 Comments

Aus Datenschutzgründen dürfen keine personenbezogenen (PII) Daten an Google Analytics gesendet werden. Das ist Gesetz und zum Schutz der Website-Nutzer. Ist das nicht der Fall erwarten dich dank DSGVO nicht nur hohe Geldstrafen, sondern Google kann auch deinen GA Account löschen. Alle bisher gesammelten Daten sind dann einfach weg. Deswegen: Überprüfe jetzt gleich ob du personenbezogene Daten in GA speicherst und erfahre was du dagegen tun kannst!

Was sind PII?

Aber zuerst mal in aller Kürze: Was sind überhaupt personenbezogene Daten? PII (Personally Identifiable Information) oder personenbezogene Daten sind Daten die eindeutig einer bestimmten Person zugeordnet werden können z.B. die Sozialversicherungsnummer, die Handynummer, Kreditkartennummer oder auch die Email Adresse. Das sind Daten die in einer 1:1 Beziehung mit einem Menschen stehen, also personenbezogen sind.

Auch der Name z.B. Michaela Linhart kann personenbezogen sein – zumindest im Zusammenhang mit zusätzlichen Informationen wie beispielsweise einem Standort: Michaela Linhart aus Innsbruck wird es nicht viele geben. Weltweit aber möglicherweise schon. D.h. Daten sind auch dann personenbezogen wenn eine Zuordnung aufgrund von anderen gespeicherten Daten erfolgen kann.

Hinweis: Dank DSGVO muss jede Webseite umfangreich über Datenschutz informieren. Du findest daher Begriffsbestimmungen und Details in meiner einfach beschriebenen Datenschutzerklärung.

Speicherst du PII in GA?

Jetzt denkst du möglicherweise, dass du solche Daten ohnehin nicht in Google Analytics speicherst: Sozialversicherungsnummer sowieso nicht, Handynummer muss auf deiner Website nicht eingeben werden… aber wie sieht es mit der Email Adresse aus?

Gibt es bei dir eine Newsletter Anmeldung? Und wenn ja, wird die Email Adresse in Plain text via GET-Parameter in der URL an dein Email System versendet? Dann speicherst du vermutlich PII in GA: Und das ist nicht erlaubt!

Wann können PII noch in GA gespeichert werden?

Immer dann wenn Daten von deinen Usern auf deiner Website eingegeben werden. Alle Arten von Formularen (Kontaktforumlar, Registrierungsformular, Newsletteranmeldung) sind also potentiell „gefährlich“.

Formularfelder gibt es übrigens auch und vor allem in Webshops, wenn User etwas kaufen, durch die Checkout Schritte springen und alle möglichen PII-Daten eingeben müssen um dein Produkt- oder deine Dienstleistung zu erwerben.

Auch die interne Suche bietet eine Eingabemöglichkeit: User können Daten eingeben, theoretisch auch mutwillig PII-Daten.

Aber nicht nur Eingabefelder bieten die Möglichkeit PII in Google Analytics einzuschleusen, auch die URL ist potentiell „gefährlich“. Hier können Parameter manipuliert oder hinzugefügt werden, die PII-Daten enthalten.

PII: Die Problematik

Das Problem dabei ist: Auch wenn du bisher nicht daran gedacht hast und auf keinen Fall mutwillig personenbezogene Daten in Google Analytics speicherst – ist es der Fall und Google kommt dir drauf, wird dein Konto gelöscht!

Es wird nicht gesperrt, es wird gelöscht: Und das heißt, dass alle deine bisher gesammelten Daten einfach weg sind. Du kannst also von heute auf morgen komplett neu mit dem Datensammeln beginnen.

Deswegen ist bei der Implementierung von Google Analytics oberste Priorität, keine personenbezogene Daten zu speichern: Das gehört bereits während dem Setup getestet und kontrolliert. Und das gehört alle paar Monate (oder zumindest 2x im Jahr) streng kontrolliert.

Wie kannst du ganz schnell herausfinden ob du betroffen bist?

Dazu müssen wir zuerst identifizieren WO überall in Google Analytics Daten mit Personenbezug gespeichert sein können. Mögliche Quellen der Verursachung sind:

  • URL Parameter und dynamische Seiten Titel
  • UTM-Parameter bei Kampagnen-Tagging
  • Custom Dimensions (und Custom Variables)
  • Interne Suche
  • Ereignisse
  • UserIDs

Hinweis: Wirf im Zuge dieser Prüfung auch einen Blick auf deine Implementierung und ob das anonymizeIP Feature aktiviert ist. Auch die IP-Adresse ist personenbezogen und darf daher nicht an Google Analytics übermittelt werden.

Los geht’s mit der Überprüfung:

Seiten URLs- und Seiten-Titel

Problem: Wenn z.B. die Email Adresse per GET-Request in der URL an das Newsletter Tool gesendet wird, wird sie im „Alle Seiten“ Bericht in Google Analytics gespeichert. Das gilt auch für alle anderen PII, die über die URL an andere Systeme übergeben werden.

Das gilt weiters auch für dynamische Seitentitel: Wenn du beispielsweise einen Login-Bereich hast, deine User persönlich willkommen heißt z.B. “Hallo Michaela Linhart, schön das du wieder da bist.” und diese Information im Seiten-Titel speicherst, gelangen sie in plain text in GA.

Überprüfung URL: Gib in Google Analytics unter Verhalten → Websitecontent –> Alle Seiten zuerst im Filter “@” ein um zu überprüfen ob Email Adressen in URLs mitgeschickt werden.

Hinweis: Email Adressen sind die häufigste Form von PII in GA. Überprüfe Stichwortartig aber auch ob du Namen, Telefonnummern, etc. in der URL findest.

Alle Seiten Report ohne PII

Screenshot: Alle Seiten Report in Google Analytics – ohne PII

Erhälst du wie im Screenshot kein Ergebnis, ist alles gut: Du speicherst keine Email Adresse in deiner URL. Yippi!

Lösung URL: Erhälst du ein Ergebnis: Keine Panik! Die Seiten-URL kann mittels Data-Import rückwirkend bereinigt werden. Wie das funktioniert, erfährst du hier. 

Überprüfung Seiten-Titel: Für das Überprüfen von Vor- und Nachnamen in Seiten-Titeln kannst du zuerst schauen ob dafür URL Parameter benutzt wurden z.B. “name=”, “vorname=”, “nachname=”, usw.

Findest du nichts, lohnt es sich auch manuell über deine URLs und Seiten-Titel drüber zu schauen:

Hinweis: Im Zuge dessen kannst du auch gleich überprüfen ob du schöne, analysierbare URLs erfasst. Falls nicht, solltest du dies ebenfalls beheben. Hier erfährst du wie. 

PII: Seite und Seitentitel in Google Analytics

Screenshot: PII: Seite und Seitentitel in Google Analytics

Hinweis: Um auf Nummer sicher zu gehen, überprüfe deine URLs und Seiten-Titel auch direkt auf deiner Website.

Lösung Seiten-Titel: Hast du PII im Seiten-Titel gefunden? Auch der Seiten Titel kann mittels Data-Import rückwirkend bereinigt werden.

Custom Dimensions und Custom Variables

Problem: Bei Custom Dimensions (CDs) und ihrer älteren Form den Custom Variables, solltest du überprüfen ob wirklich die Daten übergeben werden, die übergeben werden sollen. Wenn du beispielsweise Fehlermeldungen im Checkout Prozess trackst: Steht dann nur „Falsche Email Adresse“ in der Custom Dimension oder „Eingabe mimi@xyz.at inkorrekt“?

Auch beim tracken des ZIP Code deiner User musst du aufpassen: Beispielsweise hat jedes Haus in UK einen eigenen ZIP Code und kann daher eindeutig einer Person zugeordnet werden. Auch hier musst du darauf achten: Wer sind deine User? Woher kommen sie? Und gibt es spezielle Ausnahmen, die du beachten musst.

Überprüfung: Am besten du legst dir pro Custom Dimension einen Custom Report in GA an. Im Anschluss kannst du auch hier nach “@” für Email Adresse suchen. Für weitere Überprüfungen empfehle ich einen manuellen PII Check (oder du definierst eine geniale Regex).

Lösung CD und CV: PII gefunden? Auch und speziell Custom Dimensions können mittels Data-Import rückwirkend bereinigt werden. Custom Variables allerdings nicht und ich bin mir auch nicht sicher ob eine Bereinigung überhaupt vorgenommen werden kann.

Hinweis: Nutzt du immer noch Custom Variables, empfehle ich dir umgehend auf Custom Dimensions umzusteigen. Custom Dimensions sind die nächste Generation, die seit Universal Analytics verfügbar sind und dir mehr Möglichkeiten bieten.

Events

Problem: Hier gilt das selbe wie bei Custom Dimensions. Du musst also überprüfen ob auch wirklich nur die Daten übergeben werden, die spezifiziert worden sind.

Hinweis: Mehr zu Events erfährst du hier. 

Ein Beispiel: Deine Website verfügt über ein Kontaktformular bei dem der Name und die Email Adresse eingegeben werden muss. Diese Daten dürfen nicht an GA gesendet werden. Du hast nun zwei Möglichkeiten: Entweder du erfasst diese Daten gar nicht oder du generierst daraus eine nicht-reversible Prüfsumme (Hash Wert). Diese darf nämlich an GA übergeben werden.

Überprüfung: Genauso wie deine CDs solltest du auch deine Events regelmäßig überprüfen und analysieren. Leg dir auch dafür am besten einen Custom Report an: Beispiel

Beispiel Ereignis Report

Screenshot: Beispiel Ereignis Report in Google Analytics

Achte bei Events, dass du drei verschiedene Parameter zur Überprüfung hast: Ereignis Kategorie, Ereignis Aktion und Ereignis Label. Du musst also alle drei Parameter auf PII überprüfen.

„Lösung“ Events: PII gefunden? Das ist eher schlecht, denn Events können leider nicht rückwirkend mittels Data Import bereinigt werden. Wirf auf jeden Fall einen Blick auf meine unten notierten Lösungsvorschläge.

Site Search

Problem: Auch in der internen Suche können User beliebige Sucheingaben vornehmen. Dennoch dürfen keine Email Adressen, Telefonummern oder sonstige PII in GA landen.

Überprüfung: Eine Überprüfung nimmst du am besten über die GA Standardreports unter Verhalten → Site Search → Suchbegriffe vor.

Überprüfe hier die Eingabe deiner User: Entweder wieder über die Filter-Funktion und/oder manuell indem du deine Sucheingaben stichprobenartig durch schaust.

Tipp: Ändere die Sortierung der „Einmaligen Suchanfragen gesamt“ und überprüfe was deine User am wenigsten gesucht haben. Vermutlich wurden die gleichen PII Daten z.B. eine Email -Adresse nur ein oder zwei mal gesucht und nicht wie gängige Suchbegriffe zig Mal.

Lösung Site Search: PII gefunden? Auch das ist eher schlecht, denn auch Suchbegriffe können leider nicht rückwirkend mittels Data Import bereinigt werden. Wirf auf jeden Fall einen Blick auf meine unten notierten Lösungsvorschläge.

UTM-Parameter

Problem: Auch beim Kampagnen Tracking muss darauf geachtet werden, dass keine Daten mit Personenbezug in GA übermittelt werden. Das kann vor allem über die UTM-Parameter in der URL passieren und zwar nicht nur, weil du fälschlicherweise PII mitschickst sondern weil User die URL manipulieren.

Überprüfung: Nutze zur Überprüfung wieder einen Custom Report, der dir alle PII-relevanten Dimensionen (utm_source, utm_medium, utm_campaign, utm_content, utm_term) zeigt. Ein Check ist dadurch besonders einfach möglich.

Tipp: Nutze diesen Custom Reort als Vorlage.

Lösung UTM-Parameter: PII gefunden? Auch Kampagnen-Parameter können mittels Data-Import rückwirkend bereinigt werden.

PII entdeckt? So kannst du das Problem lösen

Hast du PII in deinem GA Konto entdeckt gibt es drei Dinge, die du sofort unternehmen solltest:

[MUST HAVE] [An dieser Stelle möchte ich darauf hinweisen, dass ich kein Anwalt bin und daher keine Rechtsauskunft sondern lediglich eine Praxis-orientierte Empfehlung gebe.]

1. Dauer identifizieren

Als aller erstes solltest du herausfinden wie lange du schon PII Daten trackst: War es vorgestern ein mal weil die IT etwas umgestellt hat? Dann ist es kein großer Schaden.

Ich empfehle dir den Fehler auszubessern und die Datenansicht weiterhin zu nutzen, da vermutlich nur eine sehr geringfügige Anzahl PII Daten erfasst wurde. Es ist sehr unwahrscheinlich das Google aufgrund dessen deinen gesamten Account löscht. Natürlich ist es theoretisch möglich – nur in der Praxis wahrscheinlich noch nie passiert…

Ist es von Anfang an, seitdem du die Website vor 3 Jahren gelaunched hast? Dann ist der Schaden erheblich und du solltest unbedingt eine Möglichkeit zur Bereinigung finden – auch unter Berücksichtigung auf DSGVO.

2. Datenimport: Möglichkeit zur Daten Bereinigung

Generell ist es in Google Analytics kaum möglich einmal getrackte Daten rückwirkend zu verändern. Frei nach dem Motto: Was liegt das pickt! 

Einzige Möglichkeit ist das bereits oben öfters erwähnte Data Import Feature. Damit kannst du einige Daten u.a. Transaktions- und Kampagnendaten nachträglich bereinigen.

Wichtig: Ein rückwirkender Datenimport geht nicht für alle Daten! Deswegen: Informiere dich im Google Support Center und setze alles daran, deine fälschlich erhobenen PII-Daten zu bereinigen.

Dank DSGVO hat Google ein weiteres Feature zur Datenbereinigung zur Verfügung gestellt: Datenbaufbewahrung / Data Retention

Exkurs: Data Retention

Mit Data Retention kannst du festlegen, wie lange deine Daten auf Nutzer- und Ereignisebene gespeichert werden sollen, bevor sie von Google automatisch für immer und ewig gelöscht werden. Diese Einstellung ist ab dem 25. Mai 2018 wirksam.

Gelöscht werden dabei Rohdaten die mit Cookies sowie Nutzerkennungen, wie der UserID und WerbeIDs, verknüpft sind.

Keine Auswirkung hat diese Einstellung allerdings auf Berichte mit aggregierten Daten – also (fast) alle Standard-Reports in Google Analytics.

Ein fiktives Beispiel zur Veranschaulichung: Ein User macht eine Transaktion. Google speichert die Transaktionsdaten samt User-Informationen in Tabelle A.

Data Retention Example - Tabelle A

Screenshot: Data Retention Example – Tabelle A

Zusätzlich wird in Tabelle B die Anzahl der Transaktionen um eins erhöht – ohne jeglichen Personenbezug.

Data Retention - Example Tabelle B

Screenshot: Data Retention – Example Tabelle B

Tabelle A ist die Rohdaten-Tabelle. Tabelle B enthält die aggregierten Daten.

Wenn du nun dein Data-Retention Fenster auf 14 Monate eingestellt hast, wird nach Ablauf dieser Zeit die Transaktion aus Tabelle A gelöscht, da sie die UserID und somit User-spezifische Informationen enthält.

Tabelle B bleibt jedoch unangetastet, da hier nur aggregierte Daten gespeichert werden, die keinen Rückschluss auf einen User zulassen.

Als nicht Google Analytics 360 User ändert sich für dich somit fast gar nichts: Du hast ohnehin keinen Zugriff auf die Rohdaten und deine aggregierten Standard-Reports bleiben wie sie sind. Alle Standardreports enthalten weiterhin alle Daten.

Nur wenn Google eine Neuberechnung durchführen soll und dabei auf die Rohdaten zugreifen muss, werden die gelöschten Daten nicht mehr herangezogen. Das passiert bei Anwendung einer sekundären Dimension, bei Segmenten und Datumsanalysen, die älter sind als die Data Retention Einstellung. Auch Custom Reports sind davon betroffen – und der User Explorer vermutlich auch.

Als GA360 und BigQuery User sieht die Welt nochmal ernster aus: Hier können die gelöschten Nutzer- und Ereignisdaten nicht mehr zur Datenabfrage genutzt werden. Allerdings liegt die Entscheidung bei dir, ob du Daten überhaupt gelöscht werden sollen.

Hinweis: Weitere Details zu Data Retention findest du im Google Support Center.

Mein Fazit: Was in erster Linie nach einer groooßen Veränderung klingt (“wohoo, GA Daten können gelöscht werden”) ist bei näherer Betrachtung eher die minimalste Umsetzung die Google vornehmen konnte um Analytics DSGVO-konform zu machen. Mehr allerdings nicht!

Denn wenn du fälschlicherweise PII Daten über die Suche oder Events erfasst, kannst du diese auch weiterhin nicht aus GA entfernen. Weder mit Data Import noch mit dem neuen Data Retention Feature. Es scheint, als wären hier die Hände gebunden…

2.1 Daten nicht bereinigbar? Löschen!

Konntest du deine Daten NICHT via Data Import Feature bereinigen, dann solltest du von dir aus die betroffene Datenansicht löschen und das Tracking neu starten. Besser jetzt, als Google kommt dir irgendwann drauf und du verlierst noch mehr Daten.

Wichtig: Diese Entscheidung solltest du nicht alleine treffen! Am besten du besprichst das mit deinem Vorgesetzten sowie einem Anwalt deines Vertrauens.

Jedenfalls solltest du eine neue Datenansicht erstellen und dein Tracking neu starten: Diesmal von Anfang an ohne dem speichern von PII.

3. Ursache identifizieren und lösen

Egal ob du deine Daten via Data Import Feature bereinigen konntest oder das Tracking neu startest: Jetzt gilt es Präventivmaßnahmen zu ergreifen!

Finde – am besten zusammen mit deiner IT – heraus WO auf deiner Website PII Daten übermittelt werden und verhindere ein Senden in Zukunft.

Dafür gibt es drei Möglichkeiten:

  1. Die Daten gar nicht an GA senden.
  2. Die Daten via Datenansichtsfilter exkludieren.
  3. Die Daten via GTM ir-reversibel umbenennen (verhashen).

1.) Wann immer es möglich ist, solltest du PII-Daten gar nicht erst an GA senden. Am schönsten wäre es natürlich, wenn das Senden durch deine IT unterbunden werden kann. Meistens müssen wir aber einen anderen Weg gehen…

2.) Direkt in Google Analytics hast du die Möglichkeit bestimmte Daten via Datenansichtsfilter zu exkludieren. Das schöne ist: Datenansichtsfilter werden VOR der Datenverarbeitung bei Google vorgenommen, d.h. du kannst dir absolut sicher sein, dass deine Daten nicht an GA übertragen werden.

Hinweis: Welche Daten du auf View-Ebene filtern kannst erfährst du hier und wie du Datenansichtsfilter sicher einsetzt hier.

Wichtig: Wenn du eine neue View anlegst, darfst du auf einen Fall vergessen deine PII-Datenansichtsfilter auch in die neue View zu übernehmen. Andernfalls werden PII auch in der neuen View erfasst.

3.) Nicht immer helfen Datenansichtsfilter weiter: Dann hast du noch die Möglichkeit das Senden von PII Daten via Google Tag Manger zu verhindern – oder nicht-reversibel zu verhashen. Also einen nicht-leserlichen Wert zu generieren. Das ist auch die Empfehlung von Google (speziell wenn es darum geht, das UserID Feature einzusetzen).

Am besten, schnellsten und einfachsten funktioniert das über den Google Tag Manager: Die folgende Lösung stammt von Simo Ahava und kannst du im Detail in Simos Blog nachlesen.

Erstelle zuerst eine Custom Javascript Variable und kopiere folgenden Code hinein:

function() {
 return function(model) {
 // Add the PII patterns into this array as objects
 var piiRegex = [{
 name: 'EMAIL',
 regex: /.{4}@.{4}/g
 }];
 
 // Fetch reference to the original sendHitTask
 var originalSendTask = model.get('sendHitTask');
 
 var i, hitPayload, parts, val;
 
 // Overwrite sendHitTask with PII purger
 model.set('sendHitTask', function(sendModel) {
 hitPayload = sendModel.get('hitPayload').split('&');
 for (i = 0; i < hitPayload.length; i++) {
 parts = hitPayload[i].split('=');
 // Double-decode, to account for web server encode + analytics.js encode
 val = decodeURIComponent(decodeURIComponent(parts[1]));
 piiRegex.forEach(function(pii) {
 val = val.replace(pii.regex, '[REDACTED ' + pii.name + ']');
 });
 parts[1] = encodeURIComponent(val);
 hitPayload[i] = parts.join('=');
 }
 sendModel.set('hitPayload', hitPayload.join('&'), true);
 originalSendTask(sendModel);
 });
 };
}

Die Variable sieht so aus:

GTM Variable

Screenshot: GTM Variable „Remove PII from Hit Payload“

Im Anschluss benötigst du nur eine kleine Adaption in deinem Pageview: Füge dazu unter „Fields to Set“ einen Custom Task ein, der die JS Variable auslöst.

GTM Pageview Tag mit Custom Task

Screenshot: GTM Pageview Tag mit Custom Task

Speichern.

Preview.

Testen.

Fertig. 🙂

Bonus Tipp: Custom Alert

Egal ob du ein super sauberes Google Analytics Konto ohne PII Daten hast (in dem Fall: Herzlichen Glückwunsch! 🙂 ) oder dich jetzt an die Bereinigung deiner Daten ran machen musst: Damit du zukünftig rechtzeitig Maßnahmen ergreifen kannst, erstell dir einen Custom Alert. Dieser informiert dich sofort per Email, sobald fälschlicherweise PII in GA einfließen: (Alles über Custom Alerts erfährst du hier!)

Custom Alert für PII Check

Screenshot: Google Analytics Custom Alert für PII Check

Mit diesem Custom Alert ersparst du dir das monatliche, manuelle Überprüfen deiner Daten und wirst sofort und pro aktiv informiert, sobald PII in GA einfließen.

Dennoch empfehle ich dir, zumindest ein mal im Jahr (oder einmal im Halbjahr) manuell über all deine Daten drüber zu schauen: Einfach damit du sicher bist, dass alles korrekt einläuft.

Alles klar?

Dann freue ich mich über ein Like, ein Share und ein Kommentar von dir. Abonniere gerne meinen Newsletter und meine Facebook Seite und lass dich automatisch über neue Beiträge informieren.

Noch nicht ganz? Schreibe mir gerne deine Fragen in die Kommentare.

Ich helfe, wo ich kann.

???? Happy Analyzing,

Deine Michaela

Immer auf dem Laufenden bleiben?

Abonniere meinen Blog und du verpasst keinen Beitrag mehr:

  • […] In den folgenden Artikeln gibt es eine detaillierte Aufstellung darüber, wie personenbezogene Informationen in Google Analytics entdeckt und vermieden werden können: https://www.metrika.de/blog/web-analytics/personenbezogene-daten-pii-analytics/ https://www.analyticskiste.blog/analytics/pii-check/ […]

  • Christoph sagt:

    Interessanter Artikel, viele Dinge davon waren mir auch nicht bewusst. Zwei Fragen habe ich jedoch dazu:

    1) Woher weißt du, dass Google den Account löscht, wenn es personenbezogene Daten findet? (Quelle?)
    2) Wenn E-Mail Adressen bei der Newsletter-Anmeldung in der URL übergeben werden und dann in Analytics auftauchen, ist das prinzipiell schlecht und ein ungewollter Nebeneffekt. Aber würde hier im Zweifel nicht trotzdem die Zustimmung der User greifen, die sie ja mit dem Double-Opt-In erteilen?

    • Hi Christoph,

      vielen Dank für deinen Kommentar! 🙂

      Zu Frage 1) Google behält sich vor Accounts zu löschen, wenn diese nicht dem Datenverarbeitungsvertrag entsprechend genutzt werden. Der Datenverarbeitungsvertrag sollte von JEDEM – auch GA Free User – unterzeichnet, an Google gesendet und eingehalten werden.

      Weitere Datenschutz Infos findest du auch hier.

      Natürlich passiert das nur, wenn Google entsprechend drauf kommt, dass es zu einem Vertragsbruch gekommen ist… Letztens war ich am MeasureCamp #11 in London und da hat ein Teilnehmer aus Brasilien erzählt, dass ihm tatsächlich sein Account gesperrt wurde. Es passiert mit Sicherheit nicht häufig ABER es ist schon passiert!

      Zu Frage 2) Klares nein! Wenn sich User zum NL anmelden stimmen sie zu, deinen NL zu erhalten – nicht aber, dass ihre personenbezogenen Daten in Analytics gespeichert werden.

      Und selbst wenn User zustimmen, dass ihre personenbezogenen Daten in Analytics gespeichert werden, sollte Analytics entsprechend dem Europäischen Datenschutzgesetzt und jetzt nochmal verstärkt entsprechend der DSGVO eingesetzt werden. Dafür bereitet sich Google auch vor und bietet ab 25. Mai 2018 die Möglichkeit Daten zu löschen – allerdings betrifft das NICHT die Daten VOR dem 25. Mai.

      Ich würde also davon abraten personenbezogene Daten in Analytics zu speichern – außerdem ist es ja auch nicht notwendig.

      Liebe Grüße,
      Michaela

  • Michael sagt:

    Hi,
    leider verstehe ich noch nicht, wie sich zB. URL-Daten mit PII über Datenimporte nachträglich verändern lassen. Gibt es hierzu Beispiele bzw. eine Anleitung?

    LG, Michael

    • Hallo Michael,

      in diesem Blogartikel habe ich Dataimport für Ecommerce Refunds im Detail beschrieben… Das ist zwar nicht das Selbe aber der Upload funktioniert bei URL und Title gleich.

      Ich hoffe, dass hilft dir weiter.

      Liebe Grüße,
      Michaela

      • Michael sagt:

        Also ich hab es jetzt probiert und es werden lediglich neue Daten geändert aber keine historischen Daten überschrieben. Was mache ich falsch?

        Original-Seitentitel: Login Beispiel-Seitentitel
        Original-URL: /login?data=beispiel@gmail.com

        Das ist in meiner CSV:
        ga:pageTitle,ga:pagePath
        Login Beispiel-Seitentitel,/login?data=email

        • Was meinst du mit „neue Daten geändert“? Der Daten-Import ist kein Filter, damit werden nicht Daten die nach dem Import in GA einfließen geändert…

          Es kann ein paar Minuten dauern, bis die Daten verarbeitet wurden. Ist jetzt immer noch keine Änderung zu sehen?

          Liebe Grüße,
          Michaela

          • Michael sagt:

            Hi,
            interessanterweise wirkt der Upload bei mir wie ein Filter. Alle Daten nach dem Upload werden entsprechend der Regel in der Datei geändert. Alle bisher gesammelten Daten blieben aber unberührt. Ich werde aus dem Verhalten von Analytics hier nicht schlau.

            LG

          • Hi Michael,

            ich habe selbst nochmal umfangreich getestet und meine Daten wurden ebenfalls rückwirkend nicht geändert…

            Ich bin davon ausgegangen, dass es so funktioniert, weil Google Analytics die Möglichkeit bietet – eben so wie du in deiner CSV-File definiert hast.

            Und weil im GA Support Center steht: „Sie können auch die bereits erfassten Standarddaten überschreiben, indem Sie beispielsweise die Dimension „Quelle“ oder „Medium“ einer Kampagne importieren.“

            Weiters steht auch, dass beim erweiterten Datenimport „die bereits erfasst und verarbeiteten Daten, für die ausgewählten Berichtsdatenansichten erweitert werden.“ Das würde erklären, warum der Dataimport bei dir wie ein Filter funktioniert.

            Zugegeben ich hatte bisher noch nicht ausprobiert die URL zu bereinigen, bin aber gerade dabei umfangreich zu testen und werde darüber demnächst auch einen Blogartikel veröffentlichen (sowie diesen selbstverständlich richtig stellen).

            Further infos coming soon…

            Liebe Grüße und sry für den Wirr-Warr,
            Michaela

  • Marion sagt:

    Liebe Michaela,
    liege ich richtig in der Annahme, dass also PII Daten nicht rückwirkend gelöscht werden können?
    Vielen Dank für Info,
    Marion

    • Hallo Marion,
      mit dem Data Import Feature hast du die Möglichkeit bei zumindest ein paar Daten rückwirkend Änderungen vorzunehmen.

      Neu ist auch das Data-Request Feature: https://support.google.com/analytics/answer/9450800?hl=de
      Damit kannst du bei Google eine Lösch-Anfrage stellen und so ggfs. bestimmte Datensätze löschen – das habe ich allerdings noch nicht probiert oder recherchiert, deswegen auch noch nicht in den Blogbeitrag aufgenommen.

      Ansonsten gibt es hier leider nur sehr wenig Spielraum.

      Liebe Grüße,
      Michaela

  • Hi Michaela,

    wie immer ein sehr guter Artikel von Dir. 🙂

    Tatsächlich habe ich jetzt den ersten Fall, dass personenbezogene Daten in Form des vollständigen Namens an Google Analytics übergeben worden sind.

    In Summe sind es seit 09/2019 ca. 47 einzelne Seitenaufrufe.

    Da ich gerade dabei bin das Google Analytics Set-Up zu restrukturieren, frage ich mich, ob ich aufgrund dessen doch lieber eine neue Property erstellen sollte?

    Wie schätzt Du hier das Risiko ein?
    Eigentlich hätte ich aufgrund der historischen Daten seit 2019 gerne die bisherige Datenansicht weiter genutzt.

    Nun bin ich hin und hergerissen, ob man doch besser nochmal komplett neu anfangen sollte.

    Ich würde mich sehr über Deine Einschätzung freuen,

    Liebe Grüße,
    Stella

    • Hallo Stella,

      vielen Dank für dein Kommentar. :-))

      Seriöserweise müsste man jetzt mit „natürlich neu beginnen“ antworten. Das würde dir vermutlich auch jeder Datenschutzbeauftragte und DSGVO-Rechtsanwalt, etc. sagen. Du solltest aber auf jeden Fall bei deinem Datenschutzbeauftragten nachfragen und auf die Antwort von ihm hören.

      Unseriöserweise würde ich aber sagen, dass du wegen 47 Seiten mit nur Vor- und Nachnamen das Tracking nicht neu starten musst. Email Adressen, SV#, etc. wären viiiiel schlimmer. In dem Fall würde ich das Tracking aber neu starten.

      Du kannst versuchen bei GA eine Löschanfrage zu stellen und die 47 Seiten bzw. ev. Sessions raus filtern lassen. Dann hättest du die Daten weg und müsstest nicht mal neu beginnen. 🙂

      Andernfalls ist es wichtig, dass du das Problem behebst und zukünftig darauf achtest keine PII zu erfassen.

      Liebe Grüße,
      Michaela