09.2022 | pandas | NaN | Braki w danych
Na starcie każdej analizy danych, jednym z bardzo istotnych kroków jest weryfikacja, czy nasz zbiór danych jest kompletny tzn. czy nie ma w nim wartości NaN. A jeżeli są, to interesuje nas skala tych braków.
Pandas w połączeniu z Matplotlib jest w stanie to szybko zwizualizować za pomocą jednej linijki kodu:
df.isna().sum().plot(kind='bar')
Pełny przykład poniżej:
Wdrażam rozwiązania analityczne, buduję raporty zarządcze i pomagam zrozumieć dane.
Korzystam z Google Marketing Cloud, Microsoft Power BI, Google Cloud oraz Python.
Pracowałem m.in. dla Credit Suisse, Phonak, Hansaton, Unitron, Nestle, IBM, Play.
Jestem współtwórcą grupy Hexe Capital SA.
Zapraszam do lektury i współpracy.
Krzysztof Surowiecki
Chcę porozmawiać o współpracy →Moje certyfikaty