07.2022 | pandas | string | split
Mamy Pandas DataFrame, w którym w jednej kolumnie są diwe wartości rozdzielone przecinkiem.
Przykładowo może to być pozycja geograficzna tzn. długość i szerokość, trzymana w kolumnie o nazwie Position.
W celu dalszych obliczeń czy operacji, bardziej wygodne może być rozdzielenie tych wartości na dwie niezalezne kolumny, o nazwach: Latitude i Longitude.
Aby to zrobić skorzystaj z konstrukcji df['nazwa_kolumny'].str.split:
# separate latitude and longitude
df[['Latitude', 'Longitude']] = df['Position'].str.split(',' , 1 , expand=True)
Dla czystości, możemy usunąć niepotrzebną kolumnę Position:
# drop column position
df = df.drop(columns='position')
Wdrażam rozwiązania analityczne, buduję raporty zarządcze i pomagam zrozumieć dane.
Korzystam z Google Marketing Cloud, Microsoft Power BI, Google Cloud oraz Python.
Pracowałem m.in. dla Credit Suisse, Phonak, Hansaton, Unitron, Nestle, IBM, Play.
Jestem współtwórcą grupy Hexe Capital SA.
Zapraszam do lektury i współpracy.
Krzysztof Surowiecki
Chcę porozmawiać o współpracy →Moje certyfikaty