Hoe accuraat zijn demografische gegevens in Google Analytics?


Tijdens de Google Analytics Summit begin oktober 2013 heeft Google demografische en interesse rapporten geïntroduceerd. Dankzij deze rapporten kan je op erg eenvoudige wijze de bezoekers van je website indelen in leeftijdscategorieën, geslacht of interessegebied. Dit biedt heel wat opportuniteiten op het vlak van segmentatie en conversie optimalisatie.

Maar zoals altijd moet je oppassen met data uit Google Analytics. Het is belangrijk dat je goed begrijpt hoe deze data verzameld en verwerkt wordt zodat je kan inschatten hoe accuraat alles is.

Hoe verzamelt Google demografische gegevens?

Activeren van demografische rapporten in Google AnalyticsVooraleer je de demografische rapporten in je eigen Analytics account kan activeren moet je gebruik maken van Google’s Doubleclick cookie. Dit is de cookie die gebruikt wordt binnen het advertentienetwerk van Google (= Google Display Network). Binnen deze cookie slaagt Google informatie op over je bezoekgedrag (of het bezoekgedrag van een specifeke browser), waarbij alle sites in rekening worden gebracht die deel uitmaken van het Display Network.

Op basis van dit uitgebreide netwerk maakt Google een inschatting van jouw demografische kenmerken en interesses. In principe is dit dus hetzelfde als wat traditionele mediakanalen al jaren doen: je kijkt graag naar The Simpsons, dus ben je waarschijnlijk een man tussen de 15-35 jaar. Alleen slaagt Google erin om veel meer data te combineren waardoor deze profielen vermoedelijk accurater zijn.

Daarnaast vermeldt Google dat ze ook rekening houden met informatie die de gebruiker hen zelf meedeelt. Dit kan via verschillende kanalen gebeuren: op één van de partnersites in het Display Network, sociale media profielen of je persoonlijke Google account.

Voor meer informatie over deze manier van segmenteren en targetten kan je altijd terecht in het AdWords helpcenter.

Hoe accuraat zijn deze demografische gegevens?

Google basseert zich dus voor een groot deel op “schattingen” aan de hand van je surfgedrag. Het is logisch dat deze meetmethode heel wat scepticisme oproept. “Alsof enkel mannen een doe-het-zelf blog bezoeken“, horen we je al sarcastisch denken.
Bovendien heeft Google lang niet over elke bezoeker van je website data én hanteren ze eendrempelwaarde om data op te nemen. Deze drempelwaarde moet de privacy van individuele bezoekers beschermen. Als een bepaalde groep dus te weinig volume heeft wordt deze data niet opgenomen. De gele waarschuwing in je Google Analytics rapporten verwijst naar de toepassing van deze drempelwaarde. Hierdoor treedt er sowieso data sampling op bij de demografische rapporten. Vaak zijn de gegevens die je ziet gebasseerd op slechts een klein deel van je bezoekers. We merken zelf dat dit vaak over minder dan 10% gaat.

Op basis van deze informatie ben je al snel geneigd om de data in je demografische rapporten te klasseren als onbetrouwbaar. Maar zoals je al wel weet durven we bij Humix pas conclusies trekken nadat we iets getest hebben. Daarom dat we op zoek gegaan zijn naar een manier om de betrouwbaarheid van de demografische rapporten te testen. We waren blijkbaar niet de eerste die hun bedenkingen hadden bij de accuraatheid, ook Neil Moree van Provenance heeft zelf een test uitgevoerd. Deze beperkte zich echter tot een erg kleine sample. We moesten dus op zoek naar een grotere sample…

Vergelijking demografische rapporten Google Analytics en CIM Internet studie

Eén van onze klanten neemt al jarenlang deel aan de CIM Internet studie (voormalig CIM Metriweb). Dit is een online bevraging waarbij het doelpubliek van een website in kaart gebracht wordt. De CIM cijfers worden publiek bekend gemaakt en worden als “onafhankelijke” maatstaaf gebruikt binnen de media- en advertentiewereld.

Doordat bij de CIM studie mensen rechtstreeks gevraagd worden naar hun leeftijd, geslacht etc. lijkt het logisch dat dit veel accuratere cijfers oplevert. Opgelet: ook zij bereiken slechts een deel van de bezoekers (niet iedereen wilt deelnemen), dus is er sprake van sampling. We hebben er echter geen zicht op hoe de verhouding sample-totale populatie juist is bij de CIM studie.

We besloten om de data uit deze CIM studie te gebruiken voor onze test. De klant waarover we hier spreken heeft immers een groot bereik (meer dan een miljoen bezoeken per maand) en reeds een overzicht van de demografische gegevens van deze bezoekers. Het enige dat nog moest gebeuren is de cijfers uit de demografische rapporten in Google Analytics hier naast leggen.

De resultaten waren verbluffend! Google Analytics rapporteert dezelfde verhoudingen als de CIM Internet studie. Voor de demografische variabelengeslacht (47% vrouwen en 53% mannen) en taal (64% Nederlands en 36% Frans) waren de verhoudingen identiek. Wat betreft leeftijd zagen we kleine verschillen. De belangrijkste oorzaak hiervoor is echter de verschillende indeling in leeftijdscategorieën. Zo rapporteert Google Analytics enkel over meerderjarigen (18-65+). Als we de minderjarigen in de CIM data echter buiten beschouwing laten merkten we dat de percentages vrij dicht bij elkaar lagen (maximale afwijking van 2%).

De enige variabele waar we duidelijk afwijkingen zagen was bij locatie. Maar deze discrepantie is logisch te verklaren: bij de CIM studie worden mensen gevraagd naar hun woonplaats. Terwijl Google Analytics de plaats vanwaar er gesurft wordt rapporteert. Hierdoor is bv. Brussel in Google Analytics veel belangrijker dan in de CIM studie. Heel wat mensen bezoeken de website immers tijdens de werkuren en dus niet vanuit hun woonplaats.

We kunnen dus concluderen dat Google er erg goed in slaagt om accurate inschattingen te maken van je doelpubliek. Voorwaarde hiervoor is wel dat je enkel conclusies trekt op basis van grote hoeveelheden data. Beperk je bij het gebruik van demografische gegevens dus nooit tot korte tijdsperiodes of low-traffic sites.

Wat weet Google over mij?

Benieuwd hoe accuraat de inschatting is die Google over jou maakt? Neem dan eens een kijkje op je Google advertentieprofiel. Dit is een pagina waar Google inzage geeft in het profiel dat ze over jou bijhouden en vanwaar deze data juist komt. Zo is mijn persoonlijk profiel erg accuraat doordat ze alle informatie uit mijn Google+ account halen.

Wat weet Google over mij?

Jente De Ridder | 17 maart 2014

Contacteer Ons