Analityka Ecommerce. BI. Wykorzystanie AI. Dark Mode: ON OFF

Integracja Google Analytics 4 z BigQuery. Opis kolejnych kroków

Integracja pomiędzy Google Analytics 4 a Google BigQuery daje dostęp do surowych danych Google Analytics. Zakres tych danych jest szerszy, niż dane dostępne domyślnie w panelu Analyticsa, tym samym otrzymujemy możliwość tworzenia poszerzonych raportów opisujących użytkowników i ich interakcję z naszym serwisem internetowym. Niniejszy post opisuje, w kolejnych krokach, jak wykonac taką integrację.

Połączenie z MSSQL Server z poziomu Google Colab

Google Colab to usługa arkuszy typu Jupyter Notebooks dostępna z poziomu przeglądarki (usług Google). W niniejszej publikacji, opisujemy jak z poziomu Google Colab, z wykorzystaniem Pythona i pakietu pyodbc, połączyć się z bazą Microsoft SQL Server, działającą w chmurze Azure Cloud. Artykuł opisuje zarówno prerekwizyty potrzebne do instalacji, jak i sam kod odpowiedzialny za zbudowanie połączenia z bazą.

Synchronizacja danych pomiędzy bazą produkcyjną Google Cloud SQL a bazą analityczną Google BigQuery

Częstym problemem jest budowa bazy analitycznej, która synchronizuje się z bazą produkcyjną, pobierając tylko wybrane zestawy danych. Niniejszy post przedstawia budowę takiej infrastruktury, w której baza produkcyjna jest oparta o Google Cloud SQL, a baza analityczna jest oparta o Google BigQuery. Dane są synchronizowane co godzinę, przyrostowo.

Universal Analytics. Wykorzystanie Google Analytics Reporting API v3 do pobrania danych i zapisu w plikach tekstowych

Proces wycofania Universal Analytics i zastąpienia go poprzez implementację Google Analytics 4, powoduje, że szukamy możliwości dla zachowania danych zgromadzonych poprzez Universal Analytics. Wydajnie i szybko można to osiągnąć poprzez wykorzystanie API. Post przedstawia bibliotekę googleAnalyticsR napisaną w języku R i dedykowaną do interakcji z API GA w wersji 3. Pobieramy dane z GA i następnie zapisujemy je do pliku.

Przegląd operacji związanych z index w Pandas

Indeks jest nieodłącznym elementem każdej ramki danych (dataframe). Dobre, przemyślane indeksowanie pozwala uzyskać efektywniejszy dostęp do danych tzn. szybszy i czytelniejszy. Pakiet pandas pozwala na szybkie wprowadzenie dowolnej kolumny jako indeks, co więcej pozwala na wprowadzenie multi-indeksów, gdzie dwie lub więcej kolumn pełni rolę indeksu. W niniejszym poście pokazujemy jak operować indeksem i jego właściwościami.

Analytics Data API. Wykorzystanie biblioteki googleAnalyticsR do pobierania danych z GA4 (część 1)

Środowisko R ma do zaoferowania bardzo interesująca bibliotekę do pobierania danych z Google Analytics 4. Biblioteka jest bardzo intuicyjna (prosta) w użyciu, co pozwala na szybkie pobranie danych Google Analytics 4 do własnej przestrzeni i następnie np. przygotowanie konkretnych zestawień czy wykresów pod nasze potrzeby. W niniejszym poście pokazujemy, jak się połączyć i jak szybko pobrać dane z Google Analytics 4.

PyScript. Python uruchamiany w przeglądarce.

Czy nie byłoby wspaniale, móc uruchomić skrypt Pythona bezpośrednio w przeglądarce internetowej? Tak, mniej więcej, brzmi jedno z haseł na stronie PyScript.net. Zapewne tak, zapewne też PyScript nie jest tu pierwszy, mamy np. WebAssembly. Osobiście jednak czuję dużą prostotę i wygodę korzystania z PyScript-a. Największy minus to szybkość działania. W niniejszym wpisie pokazuję kilka przykładów do samodzielnego uruchomienia i oceny PyScript-a.

Python i Clickup. Integracja i pobieranie danych raportowych.

ClickUp to zyskujący na popularności system zarządzania projektami. Jego główne zalety to m.in. mnogość opcji. Doskwiera mi jednak moduł raportowania, który jest stale dość skromny, jak również preferuję udostępniać dane raportujące czasy prac projektowych, poprzez zewnętrzne narzędzia np. własny dashboard zbudowany w Tableau. Niniejszy post pokazuje jak szybko wykonać taką inetgrację.

Analiza marketingowa. Wyliczenie wartości ARPU z wykorzystaniem Pandas

Wskaźnik ARPU jest to określenie średniego przychodu generowanego na wybraną jednostkę np. na jednego użytkownika lub na zdefiniowany okres czasu. Jest często wykorzystywany np. w analizie usług telekomunikacyjnych. Obrazuje on m.in. sprawność działania firmy np. w sytuacji wprowadzenia nowej oferty. Analizujemy wtedy zmianę ARPU, jej wzrost świadczy o uzyskaniu dodatkowych przychodów per jednostka. Niniejszy post obrazuje wyliczenie ARPU za pomocą pakietu Pandas.

Raporty z wykorzystaniem Python i Microsoft Power BI

Microsoft Power BI jest doskonałym narzędziem do analizy danych, zarówno w obszarze ich eksploracji, jak i wizualizacji. Co, jednak jeżeli możliwości wbudowanych mechanizmów są dla nas niewystarczające? Np. Gdy potrzebujemy zastosować niestandardową wizualizację. Doskonałym rozwiązaniem jest tu integracja Power BI z językiem Python.

Wdrażam rozwiązania analityczne, buduję raporty zarządcze i pomagam zrozumieć dane.

Korzystam z Google Marketing Cloud, Microsoft Power BI, Google Cloud oraz Python.

Pracowałem m.in. dla Credit Suisse, Phonak, Hansaton, Unitron, Nestle, IBM, Play.

Jestem współtwórcą grupy Hexe Capital SA.

Zapraszam do lektury i współpracy.

Krzysztof Surowiecki

Chcę porozmawiać o współpracy →

Moje certyfikaty