Porady. Pandas. Python. Django. Microsoft Power BI. Tableau.

Python. Funkcja str.split(). Wyodrębnienie elementów z danych strukturalnych

Funkcja str.split() w Pythonie to wbudowana metoda łańcuchów znaków, która dzieli ciąg tekstowy na listę podciągu na podstawie podanego separatora. Służy do parsowania i przetwarzania tekstu, umożliwiając łatwe wyodrębnianie elementów z danych strukturalnych, takich jak CSV czy logi.

Przykład w e-commerce

# Przykład: analiza danych sprzedażowych z pliku CSV w e-commerce
dane_sprzedaz = "2024-02-15,smartfon XYZ,599.99,2"

# Podział linii CSV na pola za pomocą split(',')
pola = dane_sprzedaz.split(',')

# Wyodrębnienie kluczowych informacji
data = pola # Data sprzedaży
produkt = pola # Nazwa produktu
cena = float(pola) # Cena jednostkowa
ilosc = int(pola) # Ilość sprzedanych sztuk

# Obliczenie obrotu
obrot = cena * ilosc
print(f"Produkt: {produkt}")
print(f"Data: {data}")
print(f"Obrót: {obrot} zł")

Kiedy i po co używać str.split()?

  • Przetwarzanie plików CSV lub TSV w e-commerce – szybkie dzielenie linii na kolumny bez bibliotek zewnętrznych.
  • Parsowanie logów serwera – wyodrębnianie adresów IP, statusów HTTP czy czasów żądań z ciągów tekstowych.
  • Normalizacja danych użytkownika – dzielenie adresów e-mail, tagów produktów czy nazw kategorii.
  • Przygotowanie danych do analizy – konwersja tekstu na listy przed agregacją w Pandas lub NumPy.

Używaj jej, gdy dane są płaskie i tekstowe, a wydajność ma znaczenie – metoda jest błyskawiczna i nie wymaga importów.