Usuwanie duplikatów pozwala zliczyć rekordy unikalne w tablicy DataFrame np. ilość unikalnych produktów nabywanych przez klientów w danym miesiącu.
Usunięcie duplikatów jest możliwe dzięki metodzie .drop_duplicates().
Ogólna forma tej metody to .drop_duplicates(subset=['kolumna1'],['kolumna2'],...).
A zatem argument metody podajemy w formie tablicy o nazwie subset=[ ] i są to nazwy kolumn, w których poszukujemy duplikatów.
Przykład zastosowania znajduje się w poniższym arkuszu: