Eines der wichtigsten Features in Google Analytics sind Datenansichts-Filter: Mit ihnen kannst du Datentöpfe bilden und einschränken. Aber noch wichtiger: Sie spielen eine bedeutungsvolle Rolle bei der Datenqualität. Deswegen zeige ich dir, wie du mit Datenansichtsfilter schöne, analysierbare URLs zauberst (und gleichzeitig das Kardinalitäts-Limit von GA umgehst).
🛑✋ACHTUNG UPDATE: Am 1. Juli 2024 wurde Universal Analytics (GA3) vollständig durch das neue Google Analytics 4 (GA4) ersetzt. Alles zur neuen Version von Google Analytics findest du hier: >> Google Analytics 4
Dieser Blogartikel ist daher veraltet.
Das geniale an GA4 ist, dass es nun zwei Dimensionen zur Seitenanalyse gibt: Seitenpfad und Abfragestring = inkl. URL-Parameter, Seitenpfad und Bildschirmname = exkl. URL-Parameter. URLs sind somit immer schön analysierbar. 🧡
Wichtig💡: Wenn du im großen WWW nach Infos zu Google Analytics suchst, ist es wichtig zu überprüfen, um welche Version es sich handelt: Universal Analytics (=alt), Google Analytics 4 (=neu).
Inhalt
Erfasst du hässliche URLs in Universal Analytics?
Vermutlich denkst du dir jetzt: Was bitte ist eine hässliche URL?
Diese URL ist nicht nur einfach nicht leserlich, sondern basiert auf einen bunten Mix aus Query Parameter und Ordner, die irgendwelche User-spezifischen Informationen enthalten.
URL Query Parameter
Query Parameter kennzeichnen sich durch ? (Fragezeichen) oder & (Und-Zeichen) z.B. ?authuser=0. Vermutlich gibt es auch ?authuser=1 oder sogar n-beliebige Zahlen.
Diese Information ist zwar für das dahinterliegende System, für die Programmierung, für die Datenbank, etc. extrem wichtig. In Google Analytics hindert es jedoch die eigentliche URL aggregiert zu analysieren: Denn statt https://analytics.google.com/analytics/web/ würde jede authuser-ID eine eigene Zeile in GA erhalten z.B.
- https://analytics.google.com/analytics/web/?authuser=0,
- https://analytics.google.com/analytics/web/?authuser=1,
- https://analytics.google.com/analytics/web/?authuser=2,
- usw.
Das bläst den URL Report in GA dermaßen auf, dass eine Analyse von einzelnen URLs kaum mehr möglich ist!
Hinweis: Natürlich könntest du dir einen einfachen Tabellenfilter auf URL contains /analytics/web setzen, wenn du diese URL speziell und alleine analysieren möchtest. Im Report selbst, erhälst du jedoch keinen Überblick über deine Daten!
URL Ordner
Ordner sind gekennzeichnet durch / (Slash) z.B. /Settings oder /a93114233w137762751p142128265.
Hier sehen wir auch schon das Problem: Während /Settings ein allgemeiner Unterordner von Google Analytics ist, ist /a93114233w137762751p142128265 irgendeine ID, die vermutlich bei jedem GA User anders ist.
Beispielsweise könnte es die verhashte GA Account ID, Property ID oder View ID sein. Es könnte aber auch eine UserID oder Profil-ID sein. Oder aber eine SessionID, die ohnehin für jeden User, für jeden GA Account und in jeder Session anders ist. Wir wissen es nicht…
Aber was wir wissen ist, dass diese ID eine Information ist, die immer unterschiedlich ist. Und somit wird diese URL auch nur ein einziges Mal in einem Report auftauchen.
Hässliche URLs: Das ist das Problem
Sowohl Query-Parameter als auch Ordner mit irgendwelchen IDs sind für die Auswertung in GA unnütz.
Einerseits weil sie meistens nur einen einzigen Treffer erzeugen und dadurch den Google Analytics Report unnötig aufblasen:
Andererseits weil sie dich geradewegs in das Kardinalitäts Limit von Google Analytics schleudern.
Google Analytics Kardinalitäts Limit
In Google Analytics werden Dimensionen mit zu vielen unterschiedlichen Inhalten zu einen einzigen zusammengefasst – nämlich: (other)
Fachmännisch heißt das: Zusammenfassung bei hoher Kardinalität.
In der gratis Variante von Google Analytics passiert das ab 50.000+ verschiedene Inhalte pro Tag: Also beispielsweise 50.000 einzelnen URLs.
Für GA360 liegt das Limit bei 75.000.
Für mehrere Tage (spezifischer ist das leider nicht beschrieben) sind 100.000 verschiedene Inhalte in GA Free möglich.
Für GA360 liegt das Limit bei 150.000.
Für eine Website mit relativ viel Traffic und vielen einzelnen URLs kann es also passieren, dass URLs unter (other) zusammengefasst werden. Und das bedeutet, dass alle übrigen URLs einfach in einen Topf geworfen und gemeinsam ausgewiesen werden.
Überprüfe JETZT ob du in das Kardinalitäts Limit fällst
Eine Überprüfung geht super rasch: Öffne dazu Google Analytics und gehe in den Berichtsbereich Verhalten → Website Content → Alle Seiten.
Findest du hier unter den Top 10 eine Zeile in der (other) steht, erfasst du zu viele unterschiedliche URLs und solltest unbedingt Datenansichtsfilter einsetzen:
Außerdem kannst du überprüfen wie viele Zeilen in GA angezeigt werden: Umso höher die Zahl umso eher wirst du früher oder später in das Kardinaltitäs-Limit fallen:
Wie oben erwähnt: Pro Tag dürfen max. 50.000 unique URLs erfasst werden. Pro mehrere Tage max. 100.000.
Lösung: So erhälst du schöne URLs
Solltest du ins Kardinalitäts-Limit fallen, solltest du unbedingt unnötige Query-Parameter und Ordner mit irgendwelchen IDs aus deinen URLs entfernen: Das ist des Rätzels Lösung!
Solltest du (noch) keine Kardinalitäts-Probleme haben, ist es trotzdem sinnvoll unnötige Daten aus deinen URLs zu entfernen: Einfach damit du saubere Daten in GA sammelst und somit saubere Analysen durchführen kannst.
Query Parameter aus URL entfernen
Query Parameter lassen sich sehr einfach aus der URL entfernen: Google Analytics hat dafür eigens eine Einstellung auf Datenansichts-Ebene.
Gehe dafür in Google Analytics auf die Administrations-Oberfläche und wähle auf Datenansichts-Ebene die “Einstellungen der Datenansicht”.
Hier findest du weiter unten “URL-Suchparameter ausschließen”.
Trage hier alle Query Parameter ein, die du für die Analyse in GA definitiv nicht benötigst. Bei mir ist das: cid,eid,fshp,token,PayerID, tpos,tList.
Hinweis #1: Ich schließe die UserID (cid) ebenfalls aus der URL aus, weil ich diesen Parameter über den Tracking Code in eine Custom Dimension speicher. Wann immer sich ein User authentifiziert (bei der Registrierung, beim Login, bei der Transaktion), wird die UserID als verhashte ID in die Custom Dimension “UserID” gespeichert. Somit brauche ich die UserID nicht zusätzlich in der URL.
Hinweis #2: Wenn du Suchbegriffe deiner internen Suche aus der URL entfernen möchtest, nutze dazu das “Site Search” Feature von Google Analytics. Hier kannst du den Query Parameter eintragen und hast die Möglichkeit den Suchbegriff aus der URL zu entfernen. Das ist sinnvoll, denn das Site Search Feature speichert den Suchbegriff ohnehin in der Dimension “Site Search Keyword”.
Und wie findest du heraus WELCHE Query-Parameter du entfernen sollst?
Dabei hilft dir ein Google Sheets Addon:
GA Parameter Extractor Add-on
Mit dem „GA Parameter Extractor“ Add-on für Google Sheets erhälst du eine übersichtliche Liste aller deiner Query-Parameter:
Du erhälst:
- den Parameter-Name,
- die Anzahl der Seitenpfade, in denen der Parameter aufgerufen wurde,
- die Anzahl der Seitenaufrufe, in denen der Parameter gesehen wurde sowie
- eine Beispiel URL.
Die Liste kannst du nun in Ruhe durchgehen und überlegen welche Parameter du weiterhin behalten möchtest bzw. welche Parameter du zukünftig aus deinen URLs entfernen möchtest.
Die zu entfernenden URLs trägst du anschließend einfach in das Query-Parameter Feld im Admin-Bereich auf Datenansichtsebene ein.
Und so funktioniert das Add-on:
Add-On installieren
Zuerst musst du das Add-On in deinem Google Chrome Browser installieren.
Anschließend ist es in JEDEM Google Sheets im Hauptmenü unter Add-ons verfügbar:
Klicke auf „Start“ um das Add-on zu starten.
Es erscheint ein Pop-up rechts in deinem Spreadsheet:
Nun gilt es den Report zu generieren:
Report generieren
Wähle dazu
- den gewünschten Google Analytics Account,
- die Property,
- die Datenansicht sowie
- das Start- und End-Datum aus.
Hinweis: Wenn du deinen gewünschten Account hier nicht findest liegt es vermutlich daran, dass du zuwenige Berechtigungen für diesen GA Account hast.
Klicke nun auf „Generate Report“.
Das Add-on erstellt ein neues Sheet mit den Parametern aus der ausgewählten Datenansicht.
Fertig. ✅
Ordner aus URL entfernen
Ordner mit SessionIDs, UserIDs, TransaktionsIDs, AccountIDs, ggfs. sogar Produktfilter oder anderen Informationen, die von User zu User unterschiedlich sind und deinen Alle-Seiten-Report zu sehr aufblasen würden, müssen über Datenansichtsfilter in Google Analytics entfernt werden.
Hinweis #1: Datenansichtsfilter in GA sind gefährlich! Du kannst dir damit deine gesamten Daten und Statistiken ruinieren. Deswegen empfehle ich dir JEDEN Datenansichtsfilter VOR der Anwendung in einer Test-Datenansicht zu testen. Um dir eine Test-Datenansicht zu erstellen, kopiere deine aktuelle Datenansicht und benenne sie Test-Datenansicht. Lege nun deine Filter zuerst in dieser an. Nachdem du deine Filter auf Richtigkeit überprüft hast, kannst du sie beruhigt in der „echten“ Datenansicht anwenden.
Hinweis #2: Datenansichtsfilter sind erst ab dem Moment aktiv, ab dem sie eingerichtet sind. Sie können nicht auf bereits gesammelte, historische Daten angewendet werden.
Gehe nun im Administrationsbereich –> Datenansicht (deine Test-Datenansicht) –> Filter –> + Filter hinzufügen um schöne, analysierbare URLs zu erstellen:
- Filter → Neuen Filter
- Filter Name: So eindeutig wie möglich z.B. Summarize Login URLs to /login
- Filtertyp: Benutzerdefiniert –> Suchen und Ersetzen
- Filtefeld: Anforderung-URI
- Suchzeichenfolge: Regex
- Ersetzungszeichenfolge: URL Neu
Die Magie passiert bei der Such- und Ersetzungsreihenfolge:
1.) Die Suchreihenfolge ist die noch hässliche URL bzw. ein Teil davon.
2.) Die Ersetzungsreihenfolge ist optional: Entweder du lässt das Feld leer, dann wird der Ordner mit der SessionID entfernt. Oder du ersetzt die hässliche URL mit einem statischen Ausdruck, damit du später in deinen Analysen noch weißt, was an dieser Stelle war. Zweites ist mein bevorzugter Weg, da dieser für mich nachvollziehbarer ist.
Ein Beispiel:
Die hässliche URL ist folgende: https://hausdorf.at/kunden/mein-login/login_logincustomer%5Blogin%5D=14213&login_logincustomer%5Baction%5D=showcustomer&cHash=fe0c80dca870261f8fc56660a66363d1
- Filter → Neuen Filter
- Filter Name: Summarize Customer Login to /customer/login
- Filtertyp: Benutzerdefiniert –> Suchen und Ersetzen
- Filterfeld: Anforderung-URI
- Suchzeichenfolge: \/kunden\/mein-login\/.*
- Ersetzungszeichenfolge: /kunden/mein-login/
Ich suche nach einem Teil der URL: Nämlich /kunden/mein-login. Mit * (Stern) in der Suchzeichenfolge nehme ich alles was nach diesem URL-Teil kommt und werfe es weg, denn keine dieser Informationen ist relevant. Das passiert durch die Ersetzungsreihenfolge, die nur mehr aus der gewünschten URL besteht.
Hinweis: Das Arbeiten mit Regular Expressions bedarf ein wenig Übung. Wenn du bisher noch gar nichts über Regex gehört hat: Im Google Analytics Support Center findest du alles was du brauchst.
Der fertige Filter sieht in Google Analytics nun so aus:
Nach dem speichern, kann es bis zu 24 Stunden dauern, bis dein Filter in der Test-Datenansicht aktiv ist: Warte also zwei volle Tage ab, bevor du deine URLs im Alle-Seiten-Report auf Richtigkeit überprüfst.
Hinweis: Ich teste meine Regular Expressions immer in einem Regex Tester, bevor ich sie in Google Analytics verwende.
Es gibt viele verschiedene Regex Tester im Internet. Ich verwende immer diesen hier: https://regex101.com/
Den habe ich total gerne, weil du sofort siehst ob eine URL matched oder nicht. Und weil du rechts neben dem Tester viele wertvolle Informationen und Erklärungen zu deiner Regular Expression erhältst.
Alles richtig gemacht, kannst du deinen Filter im Anschluss in deine Live-Datenansicht kopieren.
Aus zig hässlichen URLs wird nun eine schöne, die aggregiert analysiert werden kann: ????
Call to Action
Du hast eine Frage zum Artikel?
???? Schreibe sie einfach in die Kommentare. Ich helfe, wo ich kann.
???? Happy Analyzing,
Deine Michaela
Super hilfreicher Beitrag. Sitze gerade an einem E-Commerce Projekt und dein Vorgehen hier wird mir definitiv weiterhelfen. Vielen Dank, Michaela!
Hallo Felix,
das freut mich sehr! 🙂
Danke und lg,
Michaela