Pandas. Szybka weryfikacja braków w danych

09.2022 | pandas | NaN | Braki w danych

Na starcie każdej analizy danych, jednym z bardzo istotnych kroków jest weryfikacja, czy nasz zbiór danych jest kompletny tzn. czy nie ma w nim wartości NaN. A jeżeli są, to interesuje nas skala tych braków.

Pandas w połączeniu z Matplotlib jest w stanie to szybko zwizualizować za pomocą jednej linijki kodu:

  • df.isna().sum().plot(kind='bar')

Pełny przykład poniżej:

O Mnie

Wspieram firmy w transformacji na model działania oparty o dane. Wdrażam i wyciągam rekomendacje, płynące z danych.

Korzystam z Google Marketing Cloud, Google Cloud Platform, Tableau, Microsoft Power BI oraz Python i R.

Posiadam certyfikat Google Analytics 4 i Tableau Certified Professional, doświadczenie akademickie oraz 20-lat doświadczenia biznesowego.

Jestem Co-Founderem spółek: Hexe Capital SA, Cut2Code, Boostsite, KODA, Insightland.

Zapraszam. Krzysztof Surowiecki

Więcej o mnie Współpraca

Moje certyfikaty