Pandas. Łączenie DataFrame za pomocą Inner Join

12.2022 | pandas | DataFrame | Inner Join

Inner join to połączenie danych, które pobiera tylko część wspólną z obu zbiorów.

A zatem w nowym zbiorze znajdzie się element, który występuje w obu łączonych zbiorach.

Ilustracja Inner Join:

Inner Join

Inner join jest zatem odpowiednikiem operacji mnożenia zbiorów => czyli jest częścią wspólną dwóch zbiorów.

Realizacja Inner Join w pakiecie Pandas

Tworzymy pierwszy zbiór danych:

cars_db = {'id' : [1,2,3], 'brand': ['skoda', 'opel', 'skoda'], 'model': ['kodiaq', 'corsa', 'scala'], 'speed' : [200, 180, 210], 'price' : [250, 80, 120]}

Inner Join

Tworzymy drugi zbiór danych:

desc_equipment = {'id' : [1 , 2], 'interior' : ['white decor', 'piano decor'], 'lights' : ['top led matrix', 'led matrix'], 'engine' : ['1.5 automat PB', '2.0 manual TDI']}

Inner Join

Operacją połączenia dwóch DataFrame za pomocą Inner Join:

data = cars.merge(equipment, on="id")

Jako rezultat otrzymamy następujący DataFrame:

Inner Join

Pełny kod dla niniejszego przykładu:

O Mnie

Wspieram firmy w transformacji na model działania oparty o dane. Wdrażam i wyciągam rekomendacje, płynące z danych.

Korzystam z Google Marketing Cloud, Google Cloud Platform, Tableau, Microsoft Power BI oraz Python i R.

Posiadam certyfikat Google Analytics 4 i Tableau Certified Professional, doświadczenie akademickie oraz 20-lat doświadczenia biznesowego.

Jestem Co-Founderem spółek: Hexe Capital SA, Cut2Code, Boostsite, KODA, Insightland.

Zapraszam. Krzysztof Surowiecki

Więcej o mnie Współpraca

Moje certyfikaty