3 Cara Merge DataFrame di Pandas

Pelajari cara merge DataFrame di Pandas berikut, lengkap dengan contohnya!
RevoU Staff
June 16, 2024
5
min read

Mau Belajar

Data Analytics

?

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!
DAFTAR FULL PROGRAMCOBA COURSE GRATIS

Overview

Fungsi merge di Pandas memungkinkan penggabungan dua dataset berdasarkan kunci penggabungan yang ditentukan, mirip dengan operasi join dalam SQL. Ini berguna untuk mengintegrasikan dan menyinkronkan data dari berbagai sumber ke dalam satu DataFrame yang konsolidasi, memfasilitasi analisis yang lebih kompleks dan mendalam.

Dalam dunia Python, library Pandas menyediakan tool yang powerful, yaitu fungsi merge, yang berperan vital dalam mengolah data besar dengan cepat dan efisien.

Merge mirip dengan apa yang dilakukan dalam penggabungan tabel pada SQL. Dengan menggunakan merge, kamu bisa menyatukan informasi dari beberapa DataFrame berdasarkan kolom key yang sama atau kondisi tertentu, sehingga memudahkan dalam analisis data yang lebih kompleks.

Dengan kata lain, merge menjadi jembatan yang menghubungkan dua informasi terpisah.

Artikel ini akan membimbing kamu melalui seluk-beluk fungsi merge di Pandas, mulai dari konsep dasar sampai penggunaan lanjutannya, sehingga kamu dapat menggunakannya untuk memaksimalkan output analisis data kamu. Mari kita selami lebih dalam!

Cara Menggabungkan DataFrame dengan merge di Pandas

Berikut cara menggabungkan DataFrame dengan merge di Pandas:

#1 Merge DataFrame dengan inner join

Inner join merupakan metode penggabungan yang paling umum digunakan. Metode ini menggabungkan baris dari dua DataFrame berdasarkan key value yang cocok di kedua DataFrame tersebut.

Baris yang tidak memiliki pasangan key di kedua DataFrame tidak akan ditampilkan dalam hasil akhir.

Langkah-langkah menggunakan inner join:

  • Siapkan dua DataFrame yang ingin kamu gabungkan. Misalnya, df1 memiliki kolom 'Produk' dan 'Penjualan', lalu df2 memiliki kolom 'Produk' dan 'Harga'.
  • Selanjutnya, gunakan fungsi merge() dan spesifikasikan parameter how='inner' untuk menerapkan inner join.

Contoh:

Output:

#2 Merge DataFrame dengan left join

Left join menggabungkan baris dari dua DataFrame berdasarkan key yang cocok, tetapi hasilnya akan menyertakan semua baris dari DataFrame kiri (first DataFrame yang ditulis dalam kode). Sementara baris dari DataFrame kanan hanya akan ditampilkan jika terdapat key value yang cocok.

Untuk menggunakan left join pada DataFrame yang sama seperti contoh pertama, gunakan fungsi merge() dengan parameter how='left'.

Contoh menggunakan left join:

Output:

#3 Merge DataFrame dengan outer join

Outer join menghasilkan gabungan semua baris dari kedua DataFrame, baik yang memiliki key yang cocok maupun tidak. Jika tidak ada nilai yang cocok, akan ditampilkan nilai NaN pada kolom yang relevan.

Untuk menggunakan outer join pada DataFrame yang sama seperti contoh pertama, gunakan fungsi merge() dengan parameter how='outer'.

Contoh menggunakan outer join:

Output:

FAQs (Frequently Asked Questions)

Apa itu parameter on dalam fungsi merge Pandas?

Parameter on dalam fungsi merge pada Pandas digunakan untuk menentukan nama kolom yang akan dijadikan sebagai key penggabungan antara dua DataFrame.

Kolom ini harus terdapat di kedua DataFrame yang ingin digabung. Jika kamu menggunakan parameter on, Pandas akan mencari kolom dengan nama yang sama di kedua DataFrame tersebut, lalu menggabungkan baris berdasarkan nilai yang cocok dalam kolom itu.

Bagaimana cara menggabungkan DataFrame yang tidak memiliki kolom kunci yang sama?

Jika dua DataFrame yang ingin kamu gabungkan tidak memiliki kolom key yang sama, kamu dapat menggunakan parameter left_on dan right_on dalam fungsi merge() dari Pandas.

Parameter ini memungkinkan kamu untuk menentukan kolom yang berbeda dari masing-masing DataFrame sebagai kunci penggabungan.

Berikut cara menggunakan left_on dan right_on untuk menggabungkan DataFrame:

  • Tentukan kolom key berbeda pada masing-masing DataFrame yang ingin digabungkan.
  • Gunakan merge() dengan menyebutkan left_on dan right_on untuk menggabungkan kedua DataFrame tersebut berdasarkan kolom key yang berbeda.

Bagaimana meng-handle duplikasi kolom setelah merge?

Menghadapi duplikasi kolom setelah melakukan penggabungan (merge) menggunakan Pandas adalah situasi umum, terutama jika kedua DataFrame yang digabungkan memiliki kolom dengan nama yang sama, tetapi tidak dijadikan sebagai merge key.

Untuk mengatasi hal ini, kamu dapat menggunakan beberapa metode berikut:

  • Menggunakan parameter suffixes: parameter suffixes dalam fungsi merge() memungkinkan kamu menentukan sufiks yang akan ditambahkan ke nama kolom yang duplikat dari kedua DataFrame. Ini membantu membedakan kolom asal dari masing-masing DataFrame.
  • Membuang atau mengganti nama kolom sebelum merge: jika kamu tidak memerlukan salah satu kolom yang duplikat atau ingin menghindari kebingungan, kamu bisa membuang atau mengganti nama kolom tersebut sebelum melakukan merge.
  • Selektif dalam memilih kolom untuk merge: kamu juga bisa memilih hanya kolom-kolom tertentu yang ingin digabungkan dari kedua DataFrame, sehingga menghindari masalah duplikasi dari awal.
RevoU Staff
Kickstart your career in tech with RevoU!

Masih ragu? Coba dulu 3 hari, GRATIS
di Full-Stack Trial Class!

Rasakan pengalaman belajar di RevoU Full-Stack Program: Kelas 100% LIVE, Mini portofolio lewat hands-on assignment, Bimbingan Team Lead & small group discussion. Kalau cocok, kamu bisa lanjut daftar Full Program dengan kesempatan Fast-Track (skip semua tes seleksi masuk, langsung ke tahap akhir!)

Masih ragu? Coba dulu 3 hari, GRATIS
di Full-Stack Trial Class!

Rasakan pengalaman belajar di RevoU Full-Stack Program: Kelas 100% LIVE, Mini portofolio lewat hands-on assignment, Bimbingan Team Lead & small group discussion. Kalau cocok, kamu bisa lanjut daftar Full Program dengan kesempatan Fast-Track (skip semua tes seleksi masuk, langsung ke tahap akhir!)

Masih ragu? Coba dulu 3 hari, GRATIS
di Full-Stack Trial Class!

Rasakan pengalaman belajar di RevoU Full-Stack Program: Kelas 100% LIVE, Mini portofolio lewat hands-on assignment, Bimbingan Team Lead & small group discussion. Kalau cocok, kamu bisa lanjut daftar Full Program dengan kesempatan Fast-Track (skip semua tes seleksi masuk, langsung ke tahap akhir!)

Artikel Lainnya

Mau belajar

Data Analytics

?

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!
Daftar Isi

Mulai karirmu dalam

Data Analytics

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!

Mau Belajar

Data Analytics

?

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!

DAFTAR FULL PROGRAM

Mau Belajar

Data Analytics

?

3 Cara Merge DataFrame di Pandas

Pelajari cara merge DataFrame di Pandas berikut, lengkap dengan contohnya!
RevoU Staff
June 16, 2024
5
min read

Overview

Fungsi merge di Pandas memungkinkan penggabungan dua dataset berdasarkan kunci penggabungan yang ditentukan, mirip dengan operasi join dalam SQL. Ini berguna untuk mengintegrasikan dan menyinkronkan data dari berbagai sumber ke dalam satu DataFrame yang konsolidasi, memfasilitasi analisis yang lebih kompleks dan mendalam.

Dalam dunia Python, library Pandas menyediakan tool yang powerful, yaitu fungsi merge, yang berperan vital dalam mengolah data besar dengan cepat dan efisien.

Merge mirip dengan apa yang dilakukan dalam penggabungan tabel pada SQL. Dengan menggunakan merge, kamu bisa menyatukan informasi dari beberapa DataFrame berdasarkan kolom key yang sama atau kondisi tertentu, sehingga memudahkan dalam analisis data yang lebih kompleks.

Dengan kata lain, merge menjadi jembatan yang menghubungkan dua informasi terpisah.

Artikel ini akan membimbing kamu melalui seluk-beluk fungsi merge di Pandas, mulai dari konsep dasar sampai penggunaan lanjutannya, sehingga kamu dapat menggunakannya untuk memaksimalkan output analisis data kamu. Mari kita selami lebih dalam!

Cara Menggabungkan DataFrame dengan merge di Pandas

Berikut cara menggabungkan DataFrame dengan merge di Pandas:

#1 Merge DataFrame dengan inner join

Inner join merupakan metode penggabungan yang paling umum digunakan. Metode ini menggabungkan baris dari dua DataFrame berdasarkan key value yang cocok di kedua DataFrame tersebut.

Baris yang tidak memiliki pasangan key di kedua DataFrame tidak akan ditampilkan dalam hasil akhir.

Langkah-langkah menggunakan inner join:

  • Siapkan dua DataFrame yang ingin kamu gabungkan. Misalnya, df1 memiliki kolom 'Produk' dan 'Penjualan', lalu df2 memiliki kolom 'Produk' dan 'Harga'.
  • Selanjutnya, gunakan fungsi merge() dan spesifikasikan parameter how='inner' untuk menerapkan inner join.

Contoh:

Output:

#2 Merge DataFrame dengan left join

Left join menggabungkan baris dari dua DataFrame berdasarkan key yang cocok, tetapi hasilnya akan menyertakan semua baris dari DataFrame kiri (first DataFrame yang ditulis dalam kode). Sementara baris dari DataFrame kanan hanya akan ditampilkan jika terdapat key value yang cocok.

Untuk menggunakan left join pada DataFrame yang sama seperti contoh pertama, gunakan fungsi merge() dengan parameter how='left'.

Contoh menggunakan left join:

Output:

#3 Merge DataFrame dengan outer join

Outer join menghasilkan gabungan semua baris dari kedua DataFrame, baik yang memiliki key yang cocok maupun tidak. Jika tidak ada nilai yang cocok, akan ditampilkan nilai NaN pada kolom yang relevan.

Untuk menggunakan outer join pada DataFrame yang sama seperti contoh pertama, gunakan fungsi merge() dengan parameter how='outer'.

Contoh menggunakan outer join:

Output:

FAQs (Frequently Asked Questions)

Apa itu parameter on dalam fungsi merge Pandas?

Parameter on dalam fungsi merge pada Pandas digunakan untuk menentukan nama kolom yang akan dijadikan sebagai key penggabungan antara dua DataFrame.

Kolom ini harus terdapat di kedua DataFrame yang ingin digabung. Jika kamu menggunakan parameter on, Pandas akan mencari kolom dengan nama yang sama di kedua DataFrame tersebut, lalu menggabungkan baris berdasarkan nilai yang cocok dalam kolom itu.

Bagaimana cara menggabungkan DataFrame yang tidak memiliki kolom kunci yang sama?

Jika dua DataFrame yang ingin kamu gabungkan tidak memiliki kolom key yang sama, kamu dapat menggunakan parameter left_on dan right_on dalam fungsi merge() dari Pandas.

Parameter ini memungkinkan kamu untuk menentukan kolom yang berbeda dari masing-masing DataFrame sebagai kunci penggabungan.

Berikut cara menggunakan left_on dan right_on untuk menggabungkan DataFrame:

  • Tentukan kolom key berbeda pada masing-masing DataFrame yang ingin digabungkan.
  • Gunakan merge() dengan menyebutkan left_on dan right_on untuk menggabungkan kedua DataFrame tersebut berdasarkan kolom key yang berbeda.

Bagaimana meng-handle duplikasi kolom setelah merge?

Menghadapi duplikasi kolom setelah melakukan penggabungan (merge) menggunakan Pandas adalah situasi umum, terutama jika kedua DataFrame yang digabungkan memiliki kolom dengan nama yang sama, tetapi tidak dijadikan sebagai merge key.

Untuk mengatasi hal ini, kamu dapat menggunakan beberapa metode berikut:

  • Menggunakan parameter suffixes: parameter suffixes dalam fungsi merge() memungkinkan kamu menentukan sufiks yang akan ditambahkan ke nama kolom yang duplikat dari kedua DataFrame. Ini membantu membedakan kolom asal dari masing-masing DataFrame.
  • Membuang atau mengganti nama kolom sebelum merge: jika kamu tidak memerlukan salah satu kolom yang duplikat atau ingin menghindari kebingungan, kamu bisa membuang atau mengganti nama kolom tersebut sebelum melakukan merge.
  • Selektif dalam memilih kolom untuk merge: kamu juga bisa memilih hanya kolom-kolom tertentu yang ingin digabungkan dari kedua DataFrame, sehingga menghindari masalah duplikasi dari awal.
RevoU Staff
Kickstart your career in tech with RevoU!
Menu