Porady. Pandas. Python. Django. Microsoft Power BI. Tableau.

Pandas. Łączenie DataFrame za pomocą Left Join

12.2022 | pandas | Left Join | Łączenie DataFrame

Jeżeli dane mamy zawarte w dwóch zbiorach (DataFrame) i jeżeli istnieje wspólny klucz np. data, umer zamówienia, numer produktu, to możemy takie dane połączyć w jeden zbiór - wspólny DataFrame.

Prace zaczynamy od utworzenia dwóch DataFrame, które posłużą nam do ilustracji działania Left Join.

Przygotowanie danych

Tworzymy pierwszy DataFrame.

Zawiera on modele samochodów z generalnym opisem:

cars_db = {'id' : [1,2,3], 'brand': ['skoda', 'opel', 'skoda'], 'model': ['kodiaq', 'corsa', 'scala'], 'speed' : [200, 180, 210], 'price' : [250, 80, 120]}

cars = pd.DataFrame(data=cars_db)

Tworzymy drugi DataFrame.

Zawiera on doszczegółowienie wyposażenia i parametrów dla wybranych modeli samochodów:

desc_equipment = {'id' : [1 , 2], 'interior' : ['white decor', 'piano decor'], 'lights' : ['top led matrix', 'led matrix'], 'engine' : ['1.5 automat PB', '2.0 manual TDI']}

equipment = pd.DataFrame(data=desc_equipment)

Połączenie danych w jeden zbiór - Left Join.

Tworzymy DataFrame o nazwie cars_equipment, która zawiera dane ze zbioru cars wraz z dołączonymi informacjami ze zbioru equipment:

cars_equipment = cars.merge(equipment, on='id', how='left')

Jako wynik otrzymujemy następujący DataFrame:

Pełny kod znajduje się poniżej:

Wdrażam rozwiązania analityczne, buduję raporty zarządcze i pomagam zrozumieć dane.

Korzystam z Google Marketing Cloud, Microsoft Power BI, Google Cloud oraz Python.

Pracowałem m.in. dla Credit Suisse, Phonak, Hansaton, Unitron, Nestle, IBM, Play.

Jestem współtwórcą grupy Hexe Capital SA.

Zapraszam do lektury i współpracy.

Krzysztof Surowiecki

Chcę porozmawiać o współpracy →

Moje certyfikaty