Wie Google Analytics 4 Daten erhebt und warum sie anders aussehen als in Universal Analytics

Als Google im März 2022 ankündigte, Universal Analytics (UA) zum 1. Juli 2023 abzustellen, begannen viele Betriebe mit der Umstellung auf Google Analytics 4 (GA4). Dies bedeutet für viele einen großen Aufwand, ist GA4 doch nicht nur ein einfaches Upgrade, sondern ein komplett eigenständiges Analysetool mit neuem Tracking-Code und vielen anderen Funktionen.

Wie immer bei großen Umstellungen kommen naturgemäß viele Fragen auf. Eine, die wir immer wieder von unseren Kunden hören und die dir vermutlich auch, wenn du dich gerade in der Umstellung befindest, unter den Nägeln brennt ist: Warum sehen meine Daten anders aus? 

Dies will ich dir im folgenden Blog beantworten.

Um zu verstehen, warum sich die Daten unterscheiden, ist es aber erst einmal wichtig zu verstehen, wie die Daten überhaupt von den beiden Tools erhoben werden.

Wie Universal Analytics Daten erhebt

Universal Analytics basiert auf einem Hit-basierten Datenmodell, d. h. die kleinste Interaktions- bzw. Messeinheit für User mit deiner Webseite ist ein Hit bzw. Treffer. Ein Hit kann im Grunde alles sein, von einem Seitenaufruf über einen Klick bis hin zum Absenden eines Formulars.

Universal Analytics unterscheidet sechs Hit-Typen: 

  • Seiten-
  • Ereignis-
  • E-Commerce-
  • Soziale-Interaktions-Treffer
  • User Timings
  • Exceptions

Diese Hits bilden das Rückgrat des gesamten Trackings. Wobei letztere für den Standarduser praktisch keine Relevanz haben, da sie nur selten auftauchen.

Darauf aufbauend lassen sich neben Seitenaufrufen auch Ereignisse definieren, die alle derselben Struktur folgen. Sie brauchen in Universal Analytics immer eine Ereigniskategorie – z. B. “E-Commerce” – und idealerweise eine Ereignis-Aktion, zusätzlich können ihnen noch ein Ereignis-Label und -Wert mitgegeben werden sowie benutzerdefinierte Definitionen – z. B. Seitenautor oder ähnliches.

Die so erhobenen Daten werden dann in Universal Analytics gesammelt, zu Sitzungen zusammengefasst, vordefinierten Berichten zugeordnet und können von dort aus weiterverarbeitet werden. Manche Events, z. B. Seitenaufrufe, sind bereits vorgefertigt und werden mit der Einrichtung von UA in den Standardberichten getrackt.

Wie Google Analytics 4 Daten erhebt

Das Datenmodell von Google Analytics 4 ist im Vergleich zu dem von UA fundamental anders. GA4 ist komplett event- bzw. ereignisbasiert, Hits der verschiedenen Arten gibt es nicht mehr, jede Aktion deiner User auf deiner Website ist jetzt ohne Ausnahme ein “Event”.

GA4-Ereignisse unterscheiden sich dementsprechend auch deutlich von UA-Events. Sie sind jetzt wesentlich flexibler und lassen sich besser an individuelle Bedürfnisse anpassen.

In GA4 ist nur noch eine Eigenschaft für Events verpflichtend – sie brauchen einen Namen, um von Google Analytics erkannt zu werden. Zusätzlich können sie aber noch mit bis zu 25 Event-Parametern – diese können Text, ein Messwert oder Ähnliches sein – und bis zu 25 Nutzereigenschaften – z. B. Anmelde-Status oder Ähnliches — angereichert werden.

Diese Flexibilität hat allerdings ihren Preis: GA4 kommt mit deutlich weniger Daten „out-of-the-box“. Bevor man richtig tracken kann, sollte man sich also Gedanken machen, was getrackt werden soll und dann alle wichtigen Parameter und Nutzereigenschaften individuell definieren und hinterlegen, um spätere Fehler zu vermeiden.

An diesem Punkt entstehen für viele Unternehmen die ersten ernstzunehmenden Hürden beim Aufbau des Trackings. Dementsprechend braucht es hier eine klare Vorstellung davon, wie der Tracking-Aufbau so klug und effizient wie möglich geschehen kann. Abgesehen davon ist der Aufbau des Trackings auch etwas “technischer” geworden.

Die Struktur von Google Analytics 4 Ereignissen (s. oben) ist mitunter schon komplexer als in Universal Analytics

Gründe für die Unterschiede

Wenn du bis hierhin aufmerksam gelesen hast, hast du vermutlich jetzt schon eine ziemlich richtige Idee, warum deine Daten in GA4 anders aussehen. Obwohl GA4 der „Nachfolger“ von UA ist und über beiden Google Analytics steht, sind sie trotzdem komplett verschiedene Tools.

Durch die Umstellung auf ein Event-basiertes Datenmodell, den kompletten Wegfall von unterschiedlichen Hit-Arten in GA4, einen komplett neuen Tracking-Code und die somit fundamental unterschiedliche Erhebung der Daten sind diese nicht mehr realistisch miteinander zu vergleichen

Hinzu kommt die komplette Veränderung der Event-Struktur in GA4, so dass sich bei einer Migration von UA zu GA4 viele Events nur umständlich oder gar nicht nachbauen lassen, was schnell dazu führen kann, dass es zwar in beiden Tools Events mit demselben Namen gibt, diese aber komplett unterschiedlich messen.

Auch wenn das Datenmodell der schwerwiegendste Faktor für die Abweichungen in deinen Daten ist, so ist dies nicht der einzige. Gerade bei großen Websites mit viel Traffic ist das Datensampling – das Hochrechnen der Analytics-Daten aus einer Stichprobe für eine schnellere Verarbeitung im Tool — ein wichtiger Grund für Abweichungen.

Während bei UA ab 500 k Sitzungen (bzw. 100 Mio. Sitzungen in GA360) in den Standardreports bei komplexen Tabellen-Filtern, Segmenten, Datumsvergleichen und der Analyse langer Zeiträume automatisch gesampelt wurde, wird in den Standardreports von GA4 nicht mehr gesampelt.

Nur sogenannte explorative Datenanalysen werden ab 10 Mio. Events im Analysezeitraum gesampelt. Dies hat zur Folge, dass die Daten, welche du in GA4 siehst, deutlich seltener gesampelt sind und somit unter Umständen auch ein genaueres Bild liefern.

Hinzu kommen noch viele andere, kleinere Unterschiede, die dafür sorgen, dass deine Daten anders aussehen, wie beispielsweise Filter, welche in den Tools selbst gesetzt werden oder die Deduplizierung der Daten in GA4.

Selbst die Definition einer Sitzung oder bekannter Metriken wie der Absprungrate ist in beiden Tools deutlich voneinander abweichend. 

Noch Fragen?

Wie du siehst, ist die Frage, warum deine Daten in den verschiedenen Google Analytics Versionen unterschiedlich aussehen, komplexer als es erst scheint. Trotzdem hoffe ich, dass dir dieser Beitrag helfen konnte, deine Frage zu beantworten. 

Wenn du zukünftig oder weiterhin mit Google Analytics 4 arbeitest, ist es wichtig immer daran zu denken, dass es sich um ein komplett neues Tool handelt. Dieses kann – falls du es richtig einsetzt – deutlich mehr als UA und die neue Implementierung bietet eine Chance, dein Tracking nochmal neu zu denken und manche „Altlasten“ loszuwerden.

Dennoch sollte klar sein: Es muss zunächst das richtige Fundament gegossen werden, bevor GA4 für dich wirklich gut wird.

Du hast dein Tracking grade auf Google Analytics 4 umgestellt und hast noch weitere Fragen zu deinem neuen Tool oder bist gerade mitten im Migrationsprozess und brauchst Hilfe bei der Umsetzung? Dann vereinbare noch heute mit uns ein kostenloses Erstgespräch und wir schauen, ob und wie wir dir helfen können!

Jetzt mit uns GA4 korrekt aufsetzen
Kai Reckers

Noch mehr Insights

Was ist Unassigned Traffic in GA4, wo finde ich ihn und wie lässt er sich beheben?

Keine klare Zuordnung des Traffics zu Kanälen, kein direkter Zusammenhang zu euren Marketing-Maßnahmen – und dementsprechend keine Aussagekraft, ob eure Kampagnen wirken oder nur Geld verbrennen und euren ROI runterdrücken. Nervig, oder? Genau das passiert in vielen Setups, die wir sehen, durch den sogenannten “Unassigned”-Traffic. 

Dadurch verliert ihr wertvolle Einblicke, weil GA4 euren Traffic nicht eindeutig zuordnen kann.

Mehr erfahren >
Top