Nemilosrdně se blíží datum, kdy by měl Google zablokovat API starých Google Analytics a kdy by měl Google data smazat. Věřím, že v Googlu si spoustu lidí oddechne. Dle mého názoru se to nestane hned 1.7., jelikož uživatelé GA360 mohou nadále GA3 používat a jejich odpočítávání teprve začne. Ale uvidíme, riskovat to asi nikdo nechceme.
První otázka – potřebujete opravdu ta data?
Před rokem jsme plánovali velmi sofistikované zálohování dat. Během roku jsme ale postupně střízlivěli. Nejzajímavější pro nás byly hlavně názory některých klientů, kteří nám na férovku řekli, že žádnou zálohu nechtějí a nepotřebují.
- „Proč? K čemu mi je vědět, kolik lidí jsem měl na webu před pěti lety?“ – Pravda, nebyla žádná cookie lišta, jsou to úplně jiná data než teď.
- „Proč potřebuji zálohovat ecommerce data? Já přeci vidím, kolik jsem prodával v mém ERP“
- „Proč potřebuji zálohovat data kampaní, já přeci na FB a v Google Ads vidím, jak ta kampaň fungovala.“ – A stejně nastavení systémů je tak odlišné, že je těžké udělat stejnou kampaň i kdyby fungovala.
- K čemu mi je vidět počet formů z roku 2012 – to už je buď zoobchodované nebo tam ti lidi už stejně nejsou a je mi to k ničemu.
- „Ale joo, tak něco udělejte, kdyby náhodou, ale netravte na tom moc času, běžící kampaně jsou pro nás důležitější“
A toto nám řekli nikoliv malé firmy, ale hlavně naši větší klienti.
Od doby, co máme správně nastavené GA4 i často vidíme, jaký vlastně bordel byl v GA3, které nastavoval kdo ví kdo a bylo to několikrát předělávané. Taková data často ani nechcete zálohovat, ale přejete si jejich smazání.
A končíme s cynismem.
Jaká data zálohujeme?
Na toto jsem nedokázal najít odpověď. Dělal jsem si tedy během roku seznam věcí, co po nás opravdu někdo chtěl a já musel jít do GA3. První věc, kterou jsem si uvědomil, že nepotřebuji data po dnech. Většinou bohatě stačí data po měsíci. A díky tomu se vejdu do limitů Google Sheetu i u středně velkých projektů (statisíce uživatelů měsíčně).
Našim klientům tedy zálohujeme z GA3 následující přehledy:
- měsíc, rok, zdroj, médium, uživatelé, bounce rate, sessions, trvání návštěvy; konverze, které mám i v GA4 (co nejdelší období)
- měsíc, rok, zdroj, médium, kampaň, uživatelé, bounce rate, sessions, trvání návštěvy; konverze, které mám i v GA4 (co nejdelší období)
- měsíc, rok, stránka, unikátní zobrazení, doba na stránce (max 3 – 5 let)
- měsíc, rok, země, uživatelé, bounce rate, sessions, trvání návštěvy, konverze všechny, konverze, které mám i v GA4 (max 3 – 5 let)
- rok, město, uživatelé, bounce rate, sessions, trvání návštěvy, konverze všechny, konverze, které mám i v GA4 (max 3 – 5 let)
- měsíc, rok, kategorie události, akce události, splnění události, unikátní události (max 3 – 5 let)
Pokud je to ecommerce tak: (co nejdelší období)
- položka – přidání do košíku – prodeje – tržby
- datum, zdroj, médium, kampaň, id transakce, tržby
Dále vytvoříme PDF reportů asistovaných konverzí za období červen 2022 – červen 2023, které bohužel v GA4 takto hezky uživatelsky nejsou.
Pokud víme, že klient např. potřeboval více analyzovat newslettery nebo SMS kampaně apod. děláme vyloženě zálohy dle potřeb klienta.
Jak data přes Google Sheet zazálohovat?
Používáme zdarma dostupný Google Analytics Spreadsheet Addon.
Následně si nadefinujeme dimenze a metriky pro konkrétní report:
Nástroj pracuje vcelku spolehlivě. Nejtěžší je určit, jak se jmenuje dimenze/metrika, co zrovna potřebuji. Skvělou pomůckou je Dimensions/Metrics Explorer. Zde napíšete jméno dimenze z anglické mutace GA3 a zjistíte, jak se jmenuje dimenze v API.
Číslo cíle zjistíte v nastavení, kde jste cíle definovali. Obvykle si exportujeme pouze počet splnění cíle, relativní ukazatele jsme schopní si dopočítat.
Jaké další možnosti exportování jsme zkoušeli?
Na internetu vznikl velký počet zajímavých nástrojů, ale s většinou nemám zkušenost. Pro projekty, kde potřebujete data po dnech a hrozí dosažení limitů Google Sheetu jsme používali tuto zdařilou Python řešení UA archive. Funguje naprosto stejně jako Google Sheet back-up, jenom výstupem jsou CSV.
Zajímavý je i trial export GA3 do BigQuery na DatasLayer – bohužel placená verze je dost drahá. Velmi se mi líbila i struktura dat z exportu Supermetrics. Ale bohužel trial má pouze 14 dní data a placená verze měla 4 nuly v dolarech. A i u klientů, kde historicky bylo možné tento konektor využít, tak jsme narazili na problém, že struktura dat není úplně triviální. A vše je nutné tahat SQL dotazy. To už samo o sobě je zbytečné zdržení pro jednoduchá data.
Update 30.5.2024 – na skupině webová analytika na Facebooku se strhla zajímavá diskuse, jak export řeší další specialisté. Někteří si tvoří vlastní skripty na export do BigQuery. Byly zde zmíněny i dva tooly, které mi přijdou fajn a myslím si, že by pomohly menším/středním projektům:
- dashboard gadatarescue.com (Looker Studio šablona veřejně zde, spreadsheet s API za úplatu)
- ga3-exporter.com – hezký tool se zajímavým free tarifem
- opakovaně se v podobných diskusích zmiňuje využití Keboola, což může být také spolehlivá cesta
Jak data předat klientovi?
Klientům nasdílíme Google Drive, kde si mohou stáhnout svoje data. Rovněž, pokud chtějí, dostanou od nás dashboard s 8 stránkami dle reportů, které jsme psali výše. Máme připravenou šablonu, na kterou pouze napojíme nově vzniklé tabulky:
Uděláte mi také zálohu GA3?
Napište nám a můžeme se o tom pobavit. Náročnost podobné zálohy je 2 – 3 hodiny času. Problém u záloh ani nejsou naše časové kapacity, ale stereotypnost práce. Zálohy externích klientů tedy řešíme omezeně.