u Direct een vrijblijvende offerte aanvragen u
Google Analytics

Regex toepassen in Google Analytics

Google Analytics regex

In Google Analytics kun je de data filteren zodat deze aansluit op jouw wensen. Bepaalde segmenten van je website isoleren in een eigen rapport, een development omgeving uitsluiten, informatie beter inzichtelijk maken, enzovoorts. Een Google Analytics filter geeft meerdere opties:

  • Opnemen / Uitsluiten: alle data die voldoet aan het filter wordt wel of niet opgenomen in de dataset
  • Exact: de data moet exact voldoen aan het filter
  • Regex: de data moet voldoen aan 1 of meerdere criteria die door het regex filter worden bepaald

Voordat ik regex verder uitleg, eerst even de verschillende niveaus waarop je filters kunt toepassen.

Niveau 1: Profiel

Een Google Analytics account is niveau 1, hier stel je de algemene settings in voor de website of websites. Onder een account maak je profielen aan. Dit zijn de datasets waar je rapporten te vinden zijn. De filters die je hier invoert worden op de complete dataset toegepast. Achteraf aanpassen van filters verandert de oude al aangepaste data niet. Het is belangrijk om deze filters foutloos in te voeren.

Niveau 2: Standaardrapporten

In een profiel zie je standaardrapporten verdeeld in:

  • Doelgroep: bezoekersgegevens zoals schermresolutie, browser of apparaten
  • Advertenties: bijvoorbeeld Google Adwords
  • Verkeersbronnen: bronnen als organisch en direct, webmaster tools data en social media
  • Inhoud: site en content data zoals laadtijd, zoekopdrachten op de site en meest bekeken pagina’s
  • Conversies: doelen en e-commerce en multi-channel trechters

Bij ieder standaard rapport kun je via “geavanceerd” filters handmatig invoeren. Deze worden niet opgeslagen, ze zijn alleen van toepassing op de rapportage die je op dat moment aan het bekijken bent.

Niveau 3: Aangepaste rapporten

Naast de standaardrapporten kun je ook je eigen rapporten maken door zelf dimensies en statistieken te kiezen. De filters die je hier aanmaakt worden opgeslagen samen met het aangepaste rapport. In tegenstelling tot het Profiel kun je hier de filters achteraf aanpassen, de data veranderd dan ook.

Regex karakters uitgelegd

Regular Expressions zijn karakters die een uniek effect hebben op hoe het filter wordt uitgevoerd. Deze karakters zijn:

Symbool Uitwerking Betekenis Voorbeeld
. punt elk willekeurig teken marcon.epts matched met marconcepts, marconsepts, marconzepts, marcontepts
(elk teken, ook cijfers mag gebruikt worden op de plaats van de punt. Er móet een teken staan, dat wel, marconepts is dus niet een optie)
* asterisk nul of meer van de vorige items marco*ncepts matched met marconcepts, marcooncepts, marcoooooooncepts, etc
(het voorgaande teken mag nul of ontelbaar keer voorkomen)
+ plus één of meer van de vorige items marco+ncepts matched met marcooncepts, marcooooncepts, etc maar niet marconcepts (vergelijkbaar met asterisk, maar sluit de waarde uit die exact overeenkomt)
? vraagteken nul of één van de vorige items marc?oncepts matched met marconcepts en maroncepts (2 opties, de voorgaande letter mag wel of niet voorkomen)
() haakjes inhoud tussen haakjes als item onthouden web(development|bouw) matched met webdevelopment en webbouw
[] brackets maak een lijst van items casestudy[156] matched met casestudy1, casestudy5 en casestudy6
- min maak een lijst met een bereik casestudy[0-100] matched met casestudy1, casestudy2 t/m casestudy100
| verticale streep of seo|sea|sem matched met zowel seo, sea als sem
^ caret vanaf het begin van het veld ^marketing matched niet met internetmarketing, onlinemarketing, webmarketing, etc (er mag niets voor de caret staan)
$ dollar tot aan het eind van het veld zoekmachine$ matched niet met zoekmachineoptimalisatie, zoekmachinemarketing, etc
backslash volgende symbool negeren site.html, de backslash zorgt ervoor dat de punt niet als symbool wordt gezien
{} accolades geeft aan hoe vaak een karakter herhaald mag worden [0-9]{4}[a-z]{2} matched met 1000AA, 1234XX maar niet met 1A of 10000AAA

3 praktijkvoorbeelden

Ik ga hier niet 25 voorbeelden geven. Probeer zelf in een custom report filters uit of Google (internet staat er vol mee) naar wat je precies wilt. Deze drie voorbeelden zijn filters die ik zelf gebruik in rapporten en zeker het vermelden waard zijn.

Brand-name organic traffic

Geen moeilijk filter, maar persoonlijk vind ik hem erg handig. Onlangs een aansluitend artikel over geschreven, zie Onderscheid Branded en non-Branded organisch verkeer. Ik wil de zoekwoorden zien van organische bezoekers die niet gezocht hebben op de merknaam of een variatie daarop. Data relevant voor bijvoorbeeld mijn Google Adwords campagne of voor zicht op de zoekwoorden waar ik maar weinig (of geen) traffic mee genereer (traffic laag op zoekwoord + wel een hoog zoekvolume = slechte rankings = beter SEO-en!). Ik hoef merknaam varianten niet te zien, die wil ik uitsluiten. Ik sta toch wel op plek 1 met brand name en combinaties of variaties daarmee. Vergelijk het met een romantische date met een persoon die je al 2 jaar kent (makkie) en een blind date (oei…tricky). Trust me, de resultaten tussen beide dates verschillen.

Voorbeeld van een sanitairwinkel (collega is op zoek naar een nieuw toilet en deze is bij mij top of mind want zit thuis om de hoek, sorry Brugman, Wooning, Sanitairwinkel, de bouwmarkten en de rest). Kan me zo voorstellen dat diverse typo’s in de zoekwoorden te vinden zijn: saniedump, sani dump, sanidunp, sanadump, enzovoorts. In plaats van dat ik honderden tot duizenden zoekwoorden van het afgelopen jaar doorspit, gebruik ik gewoon regex. Zal er zo’n 99% mee uithalen (misschien wel 100%). De perfectionisten onder ons (like me) gaan de zeer buitengewone uitzonderingen extra toevoegen om uit te sluiten.

Filter

  • Actie: Uitsluiten
  • Dimensie: zoekwoord (engels: keyword)
  • Regex: sa.idump|sa.i dump|sanidu.p|sani du.p|sanidum.|sani dum.|san.dump|san. dump|sanid.mp|sani d.mp|sani.ump|sani .ump|sani.dump|sanidum|anidump|anidum

Zoals je ziet, de letters waar ik typo’s verwacht heb ik vervangen met “.” (punt), zodat daar een willekeurige letter kan staan. Copy paste gemaakt van deze varianten en een spatie tussen deel 1 en 2 van de merknaam gezet (vast een hoop mensen die een spatie gebruiken). En wat ik meestal ook doe even de varianten zonder 1e en laatste letter extra toegevoegd (mensen typen snel/slordig, die 2 letters ontbreken nogal eens).

Zoekwoord positie in Google

Van bezoekers via Google weet je welk zoekwoord ze hebben gebruikt, maar niet welke positie je stond op dat zoekwoord. Het is mogelijk om deze posities zichtbaar te maken in Google Analytics. Dit rapport bestaat uit 3 filters. Let op, het geldt alleen voor de zoekmachine Google, andere zoekmachines worden uitgesloten. Helaas pindakaas (oh Google you!!).

Filter 1

  • Actie: opnemen
  • Dimensie: medium
  • Exact: organic

Filter 2

  • Actie: opnemen
  • Dimensie: bron (engels: source)
  • Exact: google

Filter 3

Nogal wat tekst en uitleg, zie daarom deze afbeelding:

Zoekwoord Posities

Zoekwoord Posities

Subdomein tonen in pagina url

Veel websites hebben subdomeinen zoals blog.site.com of shop.site.com. Meerdere talen, een forum, blog, member-gedeelte, whatever. Een profiel per segment van je website is handig. Maar vaak wil je dan ook graag 1 profiel met álle data, echter met behoud van zicht op de subdomeinen. Anders heb je geen flauw idee tot welk segment sommige pagina’s behoren. Google Analytics toont standaard alleen de URI, dus alles achter het domein zoals /over-ons/ en niet www.site.com/over-ons/. Een filter lost dit op, zie onderstaande afbeelding (again, nogal wat uitleg dus beeld zegt alles).

Volledige URL tonen

Volledige URL tonen

Speak Your Mind

*