Datenansicht-Filter: So zauberst du dir schöne, analysierbare URLs9 min Lesezeit

Michaela Linhart Leave a Comment

Eines der wichtigsten Features in Google Analytics sind Datenansichts-Filter: Mit ihnen kannst du Datentöpfe bilden und einschränken. Aber noch wichtiger: Sie spielen eine bedeutungsvolle Rolle bei der Datenqualität. Deswegen zeige ich dir, wie du mit Datenansichtsfilter schöne, analysierbare URLs zauberst (und gleichzeitig das Kardinalitäts-Limit von GA umgehst).

Erfasst du hässliche URLs in GA?

Vermutlich denkst du dir jetzt: Was bitte ist eine hässliche URL?

Hier ein Beispiel: https://analytics.google.com/analytics/web/?authuser=0#management/Settings/a93114233w137762751p142128265/%3Fm.page%3DFilters%26m-content-filterByProfileTable.rowShow%3D10%26m-content-filterByProfileTable.rowStart%3D0%26m-content-filterByProfileTable.sortColumnId%3Drank%26m-content-filterByProfileTable.sortDescending%3Dfalse/

Diese URL ist nicht nur einfach nicht leserlich, sondern basiert auf einen bunten Mix aus Query Parameter und Ordner, die irgendwelche User-spezifischen Informationen enthalten.

URL Query Parameter

Query Parameter kennzeichnen sich durch ? (Fragezeichen) oder & (Und-Zeichen) z.B. ?authuser=0. Vermutlich gibt es auch ?authuser=1 oder sogar n-beliebige Zahlen.

Diese Information ist zwar für das dahinterliegende System, für die Programmierung, für die Datenbank, etc. extrem wichtig.  In Google Analytics hindert es jedoch die eigentliche URL aggregiert zu analysieren: Denn statt https://analytics.google.com/analytics/web/ würde jede authuser-ID eine eigene Zeile in GA erhalten z.B.

  • https://analytics.google.com/analytics/web/?authuser=0,
  • https://analytics.google.com/analytics/web/?authuser=1,
  • https://analytics.google.com/analytics/web/?authuser=2,
  • usw.

Das bläst den URL Report in GA dermaßen auf, dass eine Analyse von einzelnen URLs kaum mehr möglich ist….

Hinweis: Natürlich könntest du dir einen einfachen Tabellenfilter auf URL contains /analytics/web setzen, wenn du diese URL speziell und alleine analysieren möchtest. Im Report selbst, erhälst du jedoch keinen Überblick über deine Daten!

URL Ordner

Ordner sind gekennzeichnet durch / (Slash) z.B. /Settings oder /a93114233w137762751p142128265.

Hier sehen wir auch schon das Problem: Während /Settings ein allgemeiner Unterordner von Google Analytics ist, ist /a93114233w137762751p142128265 irgendeine ID, die vermutlich bei jedem GA User anders ist.

Beispielsweise könnte es die verhashte GA Account ID, Property ID oder View ID sein. Es könnte aber auch eine UserID oder Profil-ID sein. Oder aber eine SessionID, die ohnehin für jeden User, für jeden GA Account und in jeder Session anders ist. Wir wissen es nicht…

Aber was wir wissen ist, dass diese ID eine Information ist, die immer unterschiedlich ist. Und somit wird diese URL auch nur ein einziges Mal in einem Report auftauchen.

Hässliche URLs: Das ist das Problem

Sowohl Query-Parameter als auch Ordner mit irgendwelchen IDs sind für die Auswertung in GA unnütz: Einerseits weil sie meistens nur einen einzigen Treffer erzeugen und dadurch den GA Report unnötig aufblasen (siehe Screenshot). Andererseits weil sie dich geradewegs in das Kardinalitäts Limit von Google Analytics schleudern.

Google Analytics Alle Seiten Report

Screenshot: Google Analytics Alle Seiten Report

Google Analytics Kardinalitäts Limit

In Google Analytics werden alle Dimensionen mit zu vielen unterschiedlichen Inhalten zu einen einzigen zusammengefasst, nämlich: (other) Fachmännisch heißt das: Zusammenfassung bei hoher Kardinalität.

In der gratis Variante von GA passiert das ab 50.000+ verschiedene Inhalte pro Tag: Also beispielsweise 50.000 einzelnen URLs. Für GA360 liegt das Limit bei 75.000.

Für mehrere Tage (spezifischer ist das leider nicht beschrieben) sind 100.000 verschiedene Inhalte in GA Free und 150.000 für GA360 möglich.

Für eine Website mit relativ viel Traffic und vielen einzelnen URLs kann es also passieren, dass URLs unter (other) zusammengefasst werden. Und das bedeutet, dass alle übrigen URLs einfach in einen Topf geworfen und gemeinsam ausgewiesen werden.

Überprüfe jetzt ob du in das Kardinalitäts Limit fällst

Eine Überprüfung geht super rasch: Öffne Google Analytics und gehe in den Berichtsbereich Verhalten → Website Content → Alle Seiten.

Findest du hier unter den Top 10 eine Zeile in der (other) steht, erfasst du zu viele unterschiedliche URLs und solltest unbedingt Datenansichtsfilter einsetzen.

Google Analytics Kardinalitäts Limit

Screenshot: Google Analytics (other)-Eintrag als Hinweis auf zu hohe Kardinalität

Außerdem kannst du überprüfen wie viele Zeilen in GA angezeigt werden: Umso höher die Zahl umso eher wirst du früher oder später in das Kardinaltitäs-Limit fallen. Wie oben erwähnt: Pro Tag dürfen es max. 50.000 unique URLs sein, pro mehrere Tage max. 100.000.

Google Analytics Kardinalitäts Limit

Screenshot: Google Analytics – Zu viele Zeilen als Hinweis auf zu hohe Kardinalität

Lösung: So erhälst du schöne URLs

Solltest du in das Kardinalitäts-Limit fallen, solltest du unbedingt unnötige Query-Parameter und Ordner mit irgendwelchen IDs aus deinen URLs entfernen: Das ist des Rätzels Lösung!

Solltest du (noch) keine Kardinalitäts-Probleme haben, ist es trotzdem sinnvoll unnötige IDs aus deinen URLs zu entfernen: Einfach damit du saubere Daten in GA sammelst und somit saubere Analysen durchführen kannst.

Query Parameter aus URL entfernen

Query Parameter lassen sich sehr einfach aus der URL entfernen: Google Analytics hat dafür eigens eine Einstellung auf Datenansichts-Ebene.

Gehe dafür in GA auf die Administrations-Oberfläche und wähle auf Datenansichts-Ebene die “Einstellungen der Datenansicht”. Hier findest du weiter unten “URL-Suchparameter ausschließen”.

Trage hier alle Query Parameter ein, die du für die Analyse in GA definitiv nicht benötigst. Bei mir ist das: cid,eid,fshp,token,PayerID, tpos,tList.

Google Analytics Datenansichts Einstellungen

Screenshot: Google Analytics Datenansichts Einstellungen

Hinweis #1: Ich schließe z.B. die UserID (cid) ebenfalls aus der URL aus, weil ich diesen Parameter über den Tracking Code in eine Custom Dimension speicher. Wann immer sich ein User authentifiziert z.B. bei der Registrierung, beim Login, bei der Transaktion, die UserID wird als verhashte ID in die Custom Dimension “UserID” gespeichert. Somit brauche ich die UserID nicht zusätzlich in der URL.

Hinweis #2: Wenn du Suchbegriffe deiner internen Suche aus der URL entfernen möchtest, nutze dazu das “Site Search” Feature von GA. Hier kannst du den Query Parameter eintragen und hast die Möglichkeit den Suchbegriff aus der URL zu entfernt. Das ist sinnvoll, denn das Site Search Feature speichert den Suchbegriff ohnehin in der Dimension “Site Search Keyword”.

Ordner aus URL entfernen

Ordner mit SessionIDs, UserIDs, TransaktionsIDs, AccountIDs, ggfs. sogar Produktfilter oder anderen Informationen, die von User zu User unterschiedlich sind und deinen Alle-Seiten-Report zu sehr aufblasen würden, müssen über Datenansichtsfilter in GA entfernt werden.

Hinweis #1: Datenansichtsfilter in GA sind gefährlich! Du kannst dir damit deine gesamten Daten und Statistiken ruinieren. Deswegen empfehle ich dir JEDEN Datenansichtsfilter VOR der Anwendung in einer Test-Datenansicht zu testen. Um dir eine Test-Datenansicht zu erstellen, kopiere deine aktuelle Datenansicht und benenne sie Test-Datenansicht. Lege nun deine Filter zuerst in dieser an. Nachdem du deine Filter auf Richtigkeit überprüft hast, kannst du sie beruhigt in der echten anwenden.

Hinweis #2: Datenansichtsfilter werden erst ab dem Moment aktiv, ab dem sie eingerichtet sind. Sie können nicht auf bereits gesammelte, historische Daten angewendet werden.

Gehe nun im Administrationsbereich –> Datenansicht (deine Test-Datenansicht) –> Filter –> + Filter hinzufügen um schöne, analysierbare URLs zu erstellen:

  • Filter → Neuen Filter
  • Filter Name: So eindeutig wie möglich z.B. Summarize Login URLs to /login
  • Filtertyp: Benutzerdefiniert –> Suchen und Ersetzen
  • Filtefeld: Anforderung-URI
  • Suchzeichenfolge: Regex
  • Ersetzungszeichenfolge: URL Neu

Die Magie passiert bei der Such- und Ersetzungsreihenfolge: Die Suchreihenfolge ist die noch hässliche URL bzw. ein Teil davon. Die Ersetzungsreihenfolge ist optional: D.h. entweder du lässt das Feld leer, dann wird der Ordner mit der SessionID entfernt. Oder du ersetzt die hässliche URL mit einem statischen Ausdruck, damit du später in deinen Analysen noch weißt, was an dieser Stelle war. Zweites ist mein bevorzugter Weg, da dieser nachvollziehbarer ist.

Ein Beispiel:

Die hässliche URL ist folgende: https://hausdorf.at/kunden/mein-login/login_logincustomer%5Blogin%5D=14213&login_logincustomer%5Baction%5D=showcustomer&cHash=fe0c80dca870261f8fc56660a66363d1

  • Filter → Neuen Filter
  • Filter Name: Summarize Customer Login to /customer/login
  • Filtertyp: Benutzerdefiniert –> Suchen und Ersetzen
  • Filterfeld: Anforderung-URI
  • Suchzeichenfolge: \/kunden\/mein-login\/.*
  • Ersetzungszeichenfolge: /kunden/mein-login/

Ich suche nach einem Teil der URL: Nämlich /kunden/mein-login. Mit * (Stern) in der Suchzeichenfolge nehme ich alles was nach diesem URL-Teil kommt und werfe es weg, denn keines dieser Informationen ist relevant. Das passiert durch die Ersetzungsreihenfolge, die nur mehr aus der gewünschten URL besteht.

Hinweis: Das Arbeiten mit Regular Expressions bedarf ein wenig Übung. Wenn du bisher noch gar nichts über Regex gehört hat: Im Google Analytics Support Center findest du alles was du brauchst.

Der fertige Filter sieht in Google Analytics nun so aus:

Datensansichtsfilter URLs zusammenfassen

Screenshot: Datensansichtsfilter – URLs in Google Analytics zusammenfassen

Nach dem speichern, kann es bis zu 24 Stunden dauern, bis dein Filter in der Test-Datenansicht aktiv ist: Warte also zwei volle Tage ab, bevor du deine URLs im Alle-Seiten-Report auf Richtigkeit überprüfst.

Hinweis: Ich teste meine Regular Expressions immer in einem Regex Tester, bevor ich sie in GA verwende. Es gibt viele verschiedene Regex Tester im Internet. Ich verwende immer diesen hier: https://regex101.com/ Den habe ich total gerne, weil du sofort siehst ob eine URL matched oder nicht. Und weil du rechts neben dem Tester viele wertvolle Informationen und Erklärungen zu deiner Regular Expression erhältst. Damit wird es dir schnell viel, viel einfacher fallen Regular Expressions zu erstellen.

Alles richtig gemacht, kannst du deinen Filter im Anschluss in deine Live-Datenansicht kopieren. Aus zig hässlichen URLs wird nun eine schöne, die aggregiert analysiert werden kann.

Schöne URLs im Alle-Seiten-Report

Screenshot: Schöne URLs im Alle-Seiten-Report in Google Analytics

Wenn dir dieser Blogartikel gefallen hat, dann freue ich mich über ein Like, ein Share und einen Kommentar von dir. Abonniere gerne meinen Newsletter und meine Facebook Seite und lass dich automatisch über neue Blogbeiträge informieren. 

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.