Czym jest Data Governance?

Data Governance to kluczowy element zarządzania danymi w każdej nowoczesnej organizacji. W niniejszym artykule omawiam, czym jest Data Governance, kto powinien je wdrożyć oraz jakie korzyści przynosi. Porozmawiamy także o krokach wdrożenia oraz wyzwaniach z tym związanych. Zapraszam do lektury artykułu, aby odkryć, jak Data Governance może zrewolucjonizować Twoje podejście do danych.

Plan zarządzania danymi. Mapa drogowa do sukcesu

W dzisiejszym świecie opartym na danych, skuteczne zarządzanie nimi jest kluczem do sukcesu każdej organizacji. Dobrze skonstruowany plan zarządzania danymi zapewnia porządek, wydajność i bezpieczeństwo informacji, umożliwiając podejmowanie lepszych decyzji i współpracę zespołów. Proces ten obejmuje gromadzenie, przechowywanie, wykorzystanie i komunikację danych, a jego kluczowymi fazami są zbieranie, przechowywanie i wykorzystanie. Plan zarządzania danymi jest niezbędny dla skalowalności, bezpieczeństwa i zgodności z przepisami, a jego skuteczność zależy od jasnej komunikacji z całym zespołem.

Google Tag Manager Server-Side. Implementacja via Stape.io

Wykorzystanie kontenera GTM Server-Side, pozwala przetwarzać dane po stronie serwera i tym samym poprawia wydajność i bezpieczeństwo, a także zwiększa ochronę prywatności użytkownika. Stape.io to usługa umożliwiająca hostowanie kontenera serwerowego Google Tag Manager, która oferuje m.in. prostotę, skalowalność, pełną kontrolę kosztów czy wsparcie techniczne. Jest to ciekawa alternatywa dla domyślnego hostowania kontenera via Google Cloud Platform.

Google Tag Manager Server-Side. Implementacja via Cloud Run

Wdrożenie Google Tag Manager Server-Side daje pewne wymierne korzyści nad tradycyjnym wdrożeniem np. w kwestii prywatności, szybkości działania czy lepszej kontroli nad danymi. O ile sama koncepcja sGTM jest już dłużej obecna, o tyle jego implementacja via Cloud Run jest względnie nowa. Niniejszy artykuł pokazuje zatem krok po kroku, jak zaimplementować sGTM, korzystając z Cloud Run.

Przegląd rozwiązań… zaczynających się od słowa "Apache"

Pracując z danymi, codziennie spotykamy się z rozwiązaniami, które jako pierwsze słowo w nazwie mają “Apache” np. Apache Airflow, Apache Cassandara, Apache Hadoop etc. Osobiście bardzo lubię te rozwiązania z uwagi na … sympatyczne logotypy, które często są dalekie od korporacyjnego skrępowania. W niniejszym artykule chciałbym zrobić przegląd rozwiązań, które w swojej nazwie mają “Apache” w pierwszym członie i są "w miarę popularne", w pracy Analityka Danych. Tym samym, artykuł ma na celu uporządkowanie i wylistowanie narzędzi, które warto poznać.

Google Consent Mode v2. Przegląd dostawców

Począwszy od marca 2024, Google wymaga od wszystkich stron internetowych i aplikacji stosowania Trybu Zgody v2 (tzw. Google Consent Mode v2). Google Analytics 4 ściśle integruje się z Trybem Zgody v2, zapewniając zgodność z regulacjami, a tym samym pozwalając na analizę/zbieranie danych z uwzględnieniem preferencji użytkowników dotyczących ich prywatności. Niniejszy artykuł prezentuje przegląd dostawców rozwiązań typu CMP, czyli platform do zarządzania zgodą użytkownika.

Biblioteka Faker. Generowanie danych testowych z wykorzystaniem Pythona. Przewodnik.

Tworzenie i wykorzystanie danych testowych, jest nieodłączną częścią procesu poznawania narzędzi i bibliotek analitycznych. Jednak "ręczne tworzenie” danych testowych może być czasochłonne i podatne na błędy, dlatego warto korzystać z narzędzi, które umożliwiają generowanie danych testowych automatycznie. Jednym z popularnych narzędzi w tym zakresie jest biblioteka Faker. Dostępna w Pythonie, stanowi proste w obsłudze rozwiązanie programistyczne, które pozwala nam na generowanie danych testowych wg naszych potrzeb. Niniejszy artykuł opisuje podstawowe metody i przypadki użycia, związane z biblioteką Faker.

Google Cloud Next’23 Okiem Analityka Danych

W dniach 29-31 sierpnia 2023 miała miejsce konferencja Google Cloud Next’23. Jej efektem jest wiele nowości, w tym kilka istotnych dla analityków danych takich jak wprowadzenie Duet AI, które pozwala na wykorzystanie sztucznej inteligencji do automatyzacji zadań analitycznych. Rozszerzenie możliwości Vertex AI, czy też wprowadzenie BigQuery DataFrames. Wszystkie te istotne nowości zostały zaprezentowane w niniejszym poście.

Tablica NumPy. Szybki przegląd podstawowych operacji

Pakiet NumPy, to jedno z najważniejszych narzędzi dla każdego analityka danych. NumPy udostępnia efektywny obiekt tablicy n-wymiarowej, który umożliwia przeprowadzanie zaawansowanych operacji matematycznych i logicznych na dużych zestawach danych, jednocześnie zapewniając znacznie lepszą wydajność, w zakresie szybkości wykonywania operacji. W niniejszym artykule, przedstawiam podstawowe operacje, jakie można wykonać, na tablicach NumPy.

Wykorzystanie API Piwik PRO do pobrania i wizualizacji danych w Microsoft Power BI

Microsoft Power BI to obecnie jedno z popularniejszych rozwiązań BI do analizy, wizualizacji i wnioskowania na bazie danych analitycznych. Zaletą rozwiązań BI jest możliwość integracji danych z różnych źródeł i ujęcia ich w jednym systemie raportowania. Takimi danymi mogą być również dane z systemu typu Web Analytics, opisujące nasz serwis internetowy. Sprawdźmy zatem jak wygląda możliwość połączenia Piwik PRO z Microsoft Power BI.

Wdrażam rozwiązania analityczne, buduję raporty zarządcze i pomagam zrozumieć dane.

Korzystam z Google Marketing Cloud, Microsoft Power BI, Google Cloud oraz Python.

Pracowałem m.in. dla Credit Suisse, Phonak, Hansaton, Unitron, Nestle, IBM, Play.

Jestem współtwórcą grupy Hexe Capital SA.

Zapraszam do lektury i współpracy.

Krzysztof Surowiecki

Chcę porozmawiać o współpracy →

Moje certyfikaty