Pandas. Rozdzielenie wartości w kolumnie

07.2022 | pandas | string | split

Mamy Pandas DataFrame, w którym w jednej kolumnie są diwe wartości rozdzielone przecinkiem.

Przykładowo może to być pozycja geograficzna tzn. długość i szerokość, trzymana w kolumnie o nazwie Position.

W celu dalszych obliczeń czy operacji, bardziej wygodne może być rozdzielenie tych wartości na dwie niezalezne kolumny, o nazwach: Latitude i Longitude.

Aby to zrobić skorzystaj z konstrukcji df['nazwa_kolumny'].str.split:

# separate latitude and longitude
df[['Latitude', 'Longitude']] = df['Position'].str.split(',' , 1 , expand=True)

Dla czystości, możemy usunąć niepotrzebną kolumnę Position:

# drop column position
df = df.drop(columns='position')

O Mnie

Wspieram firmy w transformacji na model działania oparty o dane. Wdrażam i wyciągam rekomendacje, płynące z danych.

Korzystam z Google Marketing Cloud, Google Cloud Platform, Tableau, Microsoft Power BI oraz Python i R.

Posiadam certyfikat Google Analytics 4 i Tableau Certified Professional, doświadczenie akademickie oraz 20-lat doświadczenia biznesowego.

Jestem Co-Founderem spółek: Hexe Capital SA, Cut2Code, Boostsite, KODA, Insightland.

Zapraszam. Krzysztof Surowiecki

Więcej o mnie Współpraca

Moje certyfikaty