12.2022 | pandas | DataFrame | Inner Join
Inner join to połączenie danych, które pobiera tylko część wspólną z obu zbiorów.
A zatem w nowym zbiorze znajdzie się element, który występuje w obu łączonych zbiorach.
Ilustracja Inner Join:Inner join jest zatem odpowiednikiem operacji mnożenia zbiorów => czyli jest częścią wspólną dwóch zbiorów.
Realizacja Inner Join w pakiecie Pandas
Tworzymy pierwszy zbiór danych:
cars_db = {'id' : [1,2,3], 'brand': ['skoda', 'opel', 'skoda'], 'model': ['kodiaq', 'corsa', 'scala'], 'speed' : [200, 180, 210], 'price' : [250, 80, 120]}
Tworzymy drugi zbiór danych:
desc_equipment = {'id' : [1 , 2], 'interior' : ['white decor', 'piano decor'], 'lights' : ['top led matrix', 'led matrix'], 'engine' : ['1.5 automat PB', '2.0 manual TDI']}
Operacją połączenia dwóch DataFrame za pomocą Inner Join:
data = cars.merge(equipment, on="id")
Jako rezultat otrzymamy następujący DataFrame:
Pełny kod dla niniejszego przykładu:
Wdrażam rozwiązania analityczne, buduję raporty zarządcze i pomagam zrozumieć dane.
Korzystam z Google Marketing Cloud, Microsoft Power BI, Google Cloud oraz Python.
Pracowałem m.in. dla Credit Suisse, Phonak, Hansaton, Unitron, Nestle, IBM, Play.
Jestem współtwórcą grupy Hexe Capital SA.
Zapraszam do lektury i współpracy.
Krzysztof Surowiecki
Chcę porozmawiać o współpracy →Moje certyfikaty