
In Google Analytics kun je de data filteren zodat deze aansluit op jouw wensen. Bepaalde segmenten van je website isoleren in een eigen rapport, een development omgeving uitsluiten, informatie beter inzichtelijk maken, enzovoorts. Een Google Analytics filter geeft meerdere opties:
- Opnemen / Uitsluiten: alle data die voldoet aan het filter wordt wel of niet opgenomen in de dataset
- Exact: de data moet exact voldoen aan het filter
- Regex: de data moet voldoen aan 1 of meerdere criteria die door het regex filter worden bepaald
Voordat ik regex verder uitleg, eerst even de verschillende niveaus waarop je filters kunt toepassen.
Niveau 1: Profiel
Een Google Analytics account is niveau 1, hier stel je de algemene settings in voor de website of websites. Onder een account maak je profielen aan. Dit zijn de datasets waar je rapporten te vinden zijn. De filters die je hier invoert worden op de complete dataset toegepast. Achteraf aanpassen van filters verandert de oude al aangepaste data niet. Het is belangrijk om deze filters foutloos in te voeren.
Niveau 2: Standaardrapporten
In een profiel zie je standaardrapporten verdeeld in:
- Doelgroep: bezoekersgegevens zoals schermresolutie, browser of apparaten
- Advertenties: bijvoorbeeld Google Adwords
- Verkeersbronnen: bronnen als organisch en direct, webmaster tools data en social media
- Inhoud: site en content data zoals laadtijd, zoekopdrachten op de site en meest bekeken pagina’s
- Conversies: doelen en e-commerce en multi-channel trechters
Bij ieder standaard rapport kun je via “geavanceerd” filters handmatig invoeren. Deze worden niet opgeslagen, ze zijn alleen van toepassing op de rapportage die je op dat moment aan het bekijken bent.
Niveau 3: Aangepaste rapporten
Naast de standaardrapporten kun je ook je eigen rapporten maken door zelf dimensies en statistieken te kiezen. De filters die je hier aanmaakt worden opgeslagen samen met het aangepaste rapport. In tegenstelling tot het Profiel kun je hier de filters achteraf aanpassen, de data veranderd dan ook.
Regex karakters uitgelegd
Regular Expressions zijn karakters die een uniek effect hebben op hoe het filter wordt uitgevoerd. Deze karakters zijn:
| Symbool | Uitwerking | Betekenis | Voorbeeld |
| . | punt | elk willekeurig teken | marcon.epts matched met marconcepts, marconsepts, marconzepts, marcontepts (elk teken, ook cijfers mag gebruikt worden op de plaats van de punt. Er móet een teken staan, dat wel, marconepts is dus niet een optie) |
| * | asterisk | nul of meer van de vorige items | marco*ncepts matched met marconcepts, marcooncepts, marcoooooooncepts, etc (het voorgaande teken mag nul of ontelbaar keer voorkomen) |
| + | plus | één of meer van de vorige items | marco+ncepts matched met marcooncepts, marcooooncepts, etc maar niet marconcepts (vergelijkbaar met asterisk, maar sluit de waarde uit die exact overeenkomt) |
| ? | vraagteken | nul of één van de vorige items | marc?oncepts matched met marconcepts en maroncepts (2 opties, de voorgaande letter mag wel of niet voorkomen) |
| () | haakjes | inhoud tussen haakjes als item onthouden | web(development|bouw) matched met webdevelopment en webbouw |
| [] | brackets | maak een lijst van items | casestudy[156] matched met casestudy1, casestudy5 en casestudy6 |
| - | min | maak een lijst met een bereik | casestudy[0-100] matched met casestudy1, casestudy2 t/m casestudy100 |
| | | verticale streep | of | seo|sea|sem matched met zowel seo, sea als sem |
| ^ | caret | vanaf het begin van het veld | ^marketing matched niet met internetmarketing, onlinemarketing, webmarketing, etc (er mag niets voor de caret staan) |
| $ | dollar | tot aan het eind van het veld | zoekmachine$ matched niet met zoekmachineoptimalisatie, zoekmachinemarketing, etc |
| backslash | volgende symbool negeren | site.html, de backslash zorgt ervoor dat de punt niet als symbool wordt gezien | |
| {} | accolades | geeft aan hoe vaak een karakter herhaald mag worden | [0-9]{4}[a-z]{2} matched met 1000AA, 1234XX maar niet met 1A of 10000AAA |
3 praktijkvoorbeelden
Ik ga hier niet 25 voorbeelden geven. Probeer zelf in een custom report filters uit of Google (internet staat er vol mee) naar wat je precies wilt. Deze drie voorbeelden zijn filters die ik zelf gebruik in rapporten en zeker het vermelden waard zijn.
Brand-name organic traffic
Geen moeilijk filter, maar persoonlijk vind ik hem erg handig. Onlangs een aansluitend artikel over geschreven, zie Onderscheid Branded en non-Branded organisch verkeer. Ik wil de zoekwoorden zien van organische bezoekers die niet gezocht hebben op de merknaam of een variatie daarop. Data relevant voor bijvoorbeeld mijn Google Adwords campagne of voor zicht op de zoekwoorden waar ik maar weinig (of geen) traffic mee genereer (traffic laag op zoekwoord + wel een hoog zoekvolume = slechte rankings = beter SEO-en!). Ik hoef merknaam varianten niet te zien, die wil ik uitsluiten. Ik sta toch wel op plek 1 met brand name en combinaties of variaties daarmee. Vergelijk het met een romantische date met een persoon die je al 2 jaar kent (makkie) en een blind date (oei…tricky). Trust me, de resultaten tussen beide dates verschillen.
Voorbeeld van een sanitairwinkel (collega is op zoek naar een nieuw toilet en deze is bij mij top of mind want zit thuis om de hoek, sorry Brugman, Wooning, Sanitairwinkel, de bouwmarkten en de rest). Kan me zo voorstellen dat diverse typo’s in de zoekwoorden te vinden zijn: saniedump, sani dump, sanidunp, sanadump, enzovoorts. In plaats van dat ik honderden tot duizenden zoekwoorden van het afgelopen jaar doorspit, gebruik ik gewoon regex. Zal er zo’n 99% mee uithalen (misschien wel 100%). De perfectionisten onder ons (like me) gaan de zeer buitengewone uitzonderingen extra toevoegen om uit te sluiten.
Filter
- Actie: Uitsluiten
- Dimensie: zoekwoord (engels: keyword)
- Regex: sa.idump|sa.i dump|sanidu.p|sani du.p|sanidum.|sani dum.|san.dump|san. dump|sanid.mp|sani d.mp|sani.ump|sani .ump|sani.dump|sanidum|anidump|anidum
Zoals je ziet, de letters waar ik typo’s verwacht heb ik vervangen met “.” (punt), zodat daar een willekeurige letter kan staan. Copy paste gemaakt van deze varianten en een spatie tussen deel 1 en 2 van de merknaam gezet (vast een hoop mensen die een spatie gebruiken). En wat ik meestal ook doe even de varianten zonder 1e en laatste letter extra toegevoegd (mensen typen snel/slordig, die 2 letters ontbreken nogal eens).
Zoekwoord positie in Google
Van bezoekers via Google weet je welk zoekwoord ze hebben gebruikt, maar niet welke positie je stond op dat zoekwoord. Het is mogelijk om deze posities zichtbaar te maken in Google Analytics. Dit rapport bestaat uit 3 filters. Let op, het geldt alleen voor de zoekmachine Google, andere zoekmachines worden uitgesloten. Helaas pindakaas (oh Google you!!).
Filter 1
- Actie: opnemen
- Dimensie: medium
- Exact: organic
Filter 2
- Actie: opnemen
- Dimensie: bron (engels: source)
- Exact: google
Filter 3
Nogal wat tekst en uitleg, zie daarom deze afbeelding:
Zoekwoord Posities
Subdomein tonen in pagina url
Veel websites hebben subdomeinen zoals blog.site.com of shop.site.com. Meerdere talen, een forum, blog, member-gedeelte, whatever. Een profiel per segment van je website is handig. Maar vaak wil je dan ook graag 1 profiel met álle data, echter met behoud van zicht op de subdomeinen. Anders heb je geen flauw idee tot welk segment sommige pagina’s behoren. Google Analytics toont standaard alleen de URI, dus alles achter het domein zoals /over-ons/ en niet www.site.com/over-ons/. Een filter lost dit op, zie onderstaande afbeelding (again, nogal wat uitleg dus beeld zegt alles).
Volledige URL tonen
