Tutorial Seaborn Python untuk Visualisasi Data

Seaborn adalah library visualisasi data berbasis Python. Begini cara pakainya!
RevoU Staff
August 25, 2023
7
min read

Mau Belajar

Data Analytics

?

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!
DAFTAR FULL PROGRAMCOBA COURSE GRATIS

Overview

Visualisasi data sering kali menjadi jembatan antara angka mentah dan informasi berharga.

Seaborn, sebuah library visualisasi data berbasis Python, muncul sebagai alat yang menggabungkan kekuatan analitis dengan estetika visual.

Menggunakan palet warna yang menarik, kemampuan untuk menggambarkan kompleksitas statistik, dan integrasi dengan struktur data populer, Seaborn memudahkan data analyst dalam mempresentasikan cerita di balik angka-angka.

Dalam artikel ini, kamu akan belajar lebih dalam tentang Seaborn Python. Yuk, simak!

Mengenal Seaborn Python

Seaborn adalah library visualisasi data berbasis Python yang menyediakan high-level interface (antarmuka tingkat tinggi) untuk menggambar grafik statistik yang informatif.

Seaborn dibangun di atas Matplotlib, yaitu salah satu library visualisasi data paling dasar dan populer di Python. Artinya, Seaborn memanfaatkan fungsionalitas inti dari Matplotlib, sambil menambahkan lapisan abstraksi untuk memudahkan analyst membuat visualisasi yang lebih kompleks.

Menurut GeeksforGeeks, Seaborn memudahkan dalam memvisualisasikan data dengan berbagai jenis plot seperti distribusi, kategorikal, matriks, dan banyak lagi. Dengan kata lain, jika kamu ingin melihat distribusi data atau hubungan antara dua variabel, Seaborn memiliki alat yang tepat untuk melakukannya.

Tak hanya itu, Seaborn juga terintegrasi baik dengan struktur data Pandas, sehingga memungkinkan analisis dan visualisasi data menjadi lebih lancar.

Perbedaan Seaborn vs Matplotlib

Seaborn dan Matplotlib adalah dua library visualisasi data yang populer di Python, tetapi keduanya memiliki karakteristik dan kegunaan yang berbeda. 

Berikut perbedaan keduanya:

  • Desain dan estetika: secara default, Seaborn memiliki tema dan palet warna yang lebih menarik dibandingkan dengan Matplotlib. Hal ini memungkinkan kamu untuk lebih mudah membuat visualisasi tanpa perlu banyak penyesuaian.
  • Fungsionalitas: meskipun Seaborn dibangun di atas Matplotlib dan memanfaatkannya sebagai dasar, Seaborn menawarkan berbagai jenis plot khusus yang dioptimalkan untuk analisis statistik, seperti plot distribusi, plot kategorikal, dan plot matriks. Di sisi lain, Matplotlib lebih fleksibel dan memungkinkan kamu membuat hampir semua jenis visualisasi, tetapi memerlukan lebih banyak kode.
  • Integrasi dengan Pandas: Seaborn bekerja dengan sangat baik dengan DataFrame Pandas, memudahkan pengguna untuk memvisualisasikan data langsung dari DataFrame. Meskipun Matplotlib juga mendukung DataFrame Pandas, Seaborn menyediakan interface yang lebih intuitif.
  • Kustomisasi: sebagai library dasar, Matplotlib memberikan kontrol lebih besar kepada analyst dalam hal kustomisasi. Semenetara itu, Seaborn mengoptimalkan untuk kasus penggunaan umum, tetapi mungkin tidak sefleksibel Matplotlib untuk kebutuhan kustomisasi yang sangat spesifik.

Dalam prakteknya, banyak data analyst menggunakan keduanya secara bersamaan. Seaborn untuk visualisasi cepat yang menarik dan informatif, sementara Matplotlib untuk kustomisasi lebih lanjut atau jenis visualisasi yang lebih kompleks.

Instalasi Seaborn

Berikut langkah-langkah menginstal Seaborn menggunakan PIP:

#1 Persiapkan environment kerja Python

Sebelum menginstal Seaborn, pastikan kamu sudah memiliki Python dan PIP terinstal di komputermu. Jika belum, kamu bisa mendownload dan menginstal Python dari website resminya.

Saat menginstal Python, PIP biasanya sudah termasuk dalam paket instalasi.

#2 Instalasi Seaborn

Setelah memastikan PIP berfungsi dengan baik, buka terminal atau command prompt dan ketik perintah berikut:

pip install seaborn

Tunggu beberapa saat sampai proses instalasi selesai. PIP akan mengunduh dan menginstal Seaborn beserta semua dependensinya.

#3 Mengatur environment Kerja Python

Setelah Seaborn terinstal, kamu bisa mulai mengatur environment kerja Python di perangkatmu. Pertama, buat sebuah file Python baru atau buka interpreter Python interaktif. Kemudian, impor library yang diperlukan.

Untuk menggunakan Seaborn, kamu juga perlu mengimpor Matplotlib karena Seaborn dibangun di atasnya. Berikut cara mengimpornya:

Cara Memuat Data untuk Visualisasi

Sebelum memulai visualisasi data dengan Seaborn, langkah pertama yang harus dilakukan adalah memuat data yang ingin divisualisasikan.

Seaborn menyediakan beberapa cara untuk melakukan ini:

#1 Menggunakan dataset sampel dari Seaborn

Salah satu fitur menarik dari Seaborn adalah kemampuannya memuat dataset sampel yang sudah disediakan. Fitur ini berguna jika kamu ingin belajar atau bereksperimen.

Untuk memuat dataset sampel, kamu bisa menggunakan fungsi load_dataset(). Misalnya, untuk memuat dataset yang bernama 'tips', kamu bisa mengetik perintah berikut:

Fungsi head() dari Pandas digunakan untuk menampilkan lima baris pertama dari dataset..

#2 Menggunakan data yang sudah ada

Jika kamu memiliki data sendiri, misalnya dalam format CSV, kamu bisa memanfaatkan library Pandas untuk memuatnya.

Setelah data dimuat ke dalam DataFrame Pandas, kamu akan lebih mudah memvisualisasikannya dengan Seaborn. Berikut contoh cara memuat data dari file CSV:

Cara Membuat Berbagai Jenis Plot dengan Seaborn

Seaborn menawarkan berbagai jenis plot yang dapat membantu kamu dalam menganalisis dan mempresentasikan data. Berikut beberapa jenis plot Seaborn sekaligus cara membuatnya:

Scatter plot

Plot ini berguna untuk menampilkan hubungan antara dua variabel kontinu.

Line plot

Bar plot

Plot jenis ini berguna untuk membandingkan kuantitas variabel kategorikal.

Histogram

Histogram dipakai untuk menampilkan distribusi dari satu variabel kontinu.

Box plot

Box plot menunjukkan distribusi data melalui kuartil dan dapat mengidentifikasi pencilan.

Heatmap

Heatmap berguna untuk menampilkan korelasi atau hubungan antara dua variabel kategorikal.

{{COMPONENT_IDENTIFIER}}

Cara Mengubah Tampilan Plot dengan Seaborn

Berikut beberapa cara mengubah tampilan plot dengan Seaborn:

  • Mengubah warna plot: Seaborn memiliki palet warna beragam yang dapat kamu gunakan untuk mempercantik plot. Misalnya, jika kamu ingin mengubah warna scatter plot, gunakan perintah berikut:
  • Menambahkan dan mengkustomisasi label: label sangat penting untuk memastikan bahwa audiens memahami informasi yang disajikan. Berikut perintah untuk menggunakannya:
  • Mengubah style plot: Seaborn memungkinkan kamu mengubah style backround plot dengan fungsi set_style().
  • Menyesuaikan ukuran dan bentuk titik: pada scatter plot, kamu bisa mengubah ukuran dan bentuk titik berdasarkan variabel tertentu.
  • Menggunakan tema: Seaborn menyediakan beberapa tema bawaan yang dapat kamu gunakan untuk mengubah tampilan keseluruhan plot dengan mudah.

Dengan mengkombinasikan berbagai fitur kustomisasi di atas, kamu bisa membuat visualisasi yang tidak hanya informatif, tetapi juga mudah dipahami oleh audiens.

Cara Membuat Heatmap dan Korelasi dengan Seaborn

Heatmap adalah salah satu jenis visualisasi untuk menampilkan hubungan antara dua variabel kategorikal atau untuk menampilkan korelasi antara variabel-variabel dalam dataset.

Pada konteks analisis data, heatmap sering dipakai untuk memvisualisasikan matriks korelasi antara variabel.

Berikut cara membuat heatmap untuk matriks korelasi.

Pertama-tama, kamu perlu menghitung matriks korelasi dari dataset menggunakan Pandas. Kemudian, kamu bisa memvisualisasikannya dengan Seaborn.

Dalam kode di atas, data.corr() menghitung matriks korelasi dari dataset. Parameter annot=True memastikan bahwa nilai korelasi ditampilkan di dalam sel heatmap. Sementara cmap digunakan untuk menentukan palet warna.

Jika kamu ingin mengubah format annotation pada heatmap, kamu bisa menambahkan parameter fmt. Contoh:

Dengan menambahkan fmt='.4f', nilai korelasi akan ditampilkan dengan empat angka desimal.

Selain membuat matriks korelasi, heatmap juga memungkinkan kamu dengan cepat mengidentifikasi hubungan antara variabel.

Warna yang lebih hangat (misalnya, merah atau oranye) biasanya menunjukkan korelasi positif yang kuat, sedangkan warna yang lebih dingin (seperti biru) menunjukkan korelasi negatif. Jika sel dalam heatmap berwarna netral atau mendekati nol, menunjukkan tidak ada korelasi yang signifikan antara dua variabel tersebut.

Dengan memahami pola warna ini, kamu lebih cepat menentukan variabel mana yang memiliki hubungan kuat atau lemah satu sama lain.

FAQ (Frequently Ask Question)

Bagaimana cara menambahkan judul dan label ke plot Seaborn?

Meskipun Seaborn memfasilitasi pembuatan plot, untuk menambahkan judul dan label, kamu biasanya akan menggunakan fungsi dari Matplotlib seperti plt.title(), plt.xlabel(), dan plt.ylabel().

Dapatkah menggunakan Seaborn dengan Jupyter Notebook atau Google Colab?

Ya, Seaborn dapat dengan mudah digunakan dalam Jupyter Notebook, Google Colab, atau platform lain yang mendukung eksekusi kode Python.

Penutup

Seaborn Python adalah alat visualisasi data yang menggabungkan kekuatan teknis dengan estetika visual untuk menghadirkan wawasan mendalam dari dataset.

Sepanjang pembahasan di atas, kita telah menyelami berbagai aspek dari Seaborn, mulai dari instalasi, memuat data, sampai kustomisasi plot untuk memaksimalkan informasi yang disampaikan. Dengan kemampuannya untuk memvisualisasikan hubungan antar variabel, mengidentifikasi tren, serta menampilkan distribusi data dengan cara yang mudah dipahami, Seaborn telah membuktikan sebagai library yang harus dipelajari.

RevoU Staff
Kickstart your career in tech with RevoU!

Masih ragu? Coba dulu 3 hari, GRATIS
di Full-Stack Trial Class!

Rasakan pengalaman belajar di RevoU Full-Stack Program: Kelas 100% LIVE, Mini portofolio lewat hands-on assignment, Bimbingan Team Lead & small group discussion. Kalau cocok, kamu bisa lanjut daftar Full Program dengan kesempatan Fast-Track (skip semua tes seleksi masuk, langsung ke tahap akhir!)

Masih ragu? Coba dulu 3 hari, GRATIS
di Full-Stack Trial Class!

Rasakan pengalaman belajar di RevoU Full-Stack Program: Kelas 100% LIVE, Mini portofolio lewat hands-on assignment, Bimbingan Team Lead & small group discussion. Kalau cocok, kamu bisa lanjut daftar Full Program dengan kesempatan Fast-Track (skip semua tes seleksi masuk, langsung ke tahap akhir!)

Masih ragu? Coba dulu 3 hari, GRATIS
di Full-Stack Trial Class!

Rasakan pengalaman belajar di RevoU Full-Stack Program: Kelas 100% LIVE, Mini portofolio lewat hands-on assignment, Bimbingan Team Lead & small group discussion. Kalau cocok, kamu bisa lanjut daftar Full Program dengan kesempatan Fast-Track (skip semua tes seleksi masuk, langsung ke tahap akhir!)

Artikel Lainnya

Mau belajar

Data Analytics

?

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!
Daftar Isi

Mulai karirmu dalam

Data Analytics

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!

Mau Belajar

Data Analytics

?

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!

DAFTAR FULL PROGRAM

Mau Belajar

Data Analytics

?

Tutorial Seaborn Python untuk Visualisasi Data

Seaborn adalah library visualisasi data berbasis Python. Begini cara pakainya!
RevoU Staff
August 25, 2023
7
min read

Overview

Visualisasi data sering kali menjadi jembatan antara angka mentah dan informasi berharga.

Seaborn, sebuah library visualisasi data berbasis Python, muncul sebagai alat yang menggabungkan kekuatan analitis dengan estetika visual.

Menggunakan palet warna yang menarik, kemampuan untuk menggambarkan kompleksitas statistik, dan integrasi dengan struktur data populer, Seaborn memudahkan data analyst dalam mempresentasikan cerita di balik angka-angka.

Dalam artikel ini, kamu akan belajar lebih dalam tentang Seaborn Python. Yuk, simak!

Mengenal Seaborn Python

Seaborn adalah library visualisasi data berbasis Python yang menyediakan high-level interface (antarmuka tingkat tinggi) untuk menggambar grafik statistik yang informatif.

Seaborn dibangun di atas Matplotlib, yaitu salah satu library visualisasi data paling dasar dan populer di Python. Artinya, Seaborn memanfaatkan fungsionalitas inti dari Matplotlib, sambil menambahkan lapisan abstraksi untuk memudahkan analyst membuat visualisasi yang lebih kompleks.

Menurut GeeksforGeeks, Seaborn memudahkan dalam memvisualisasikan data dengan berbagai jenis plot seperti distribusi, kategorikal, matriks, dan banyak lagi. Dengan kata lain, jika kamu ingin melihat distribusi data atau hubungan antara dua variabel, Seaborn memiliki alat yang tepat untuk melakukannya.

Tak hanya itu, Seaborn juga terintegrasi baik dengan struktur data Pandas, sehingga memungkinkan analisis dan visualisasi data menjadi lebih lancar.

Perbedaan Seaborn vs Matplotlib

Seaborn dan Matplotlib adalah dua library visualisasi data yang populer di Python, tetapi keduanya memiliki karakteristik dan kegunaan yang berbeda. 

Berikut perbedaan keduanya:

  • Desain dan estetika: secara default, Seaborn memiliki tema dan palet warna yang lebih menarik dibandingkan dengan Matplotlib. Hal ini memungkinkan kamu untuk lebih mudah membuat visualisasi tanpa perlu banyak penyesuaian.
  • Fungsionalitas: meskipun Seaborn dibangun di atas Matplotlib dan memanfaatkannya sebagai dasar, Seaborn menawarkan berbagai jenis plot khusus yang dioptimalkan untuk analisis statistik, seperti plot distribusi, plot kategorikal, dan plot matriks. Di sisi lain, Matplotlib lebih fleksibel dan memungkinkan kamu membuat hampir semua jenis visualisasi, tetapi memerlukan lebih banyak kode.
  • Integrasi dengan Pandas: Seaborn bekerja dengan sangat baik dengan DataFrame Pandas, memudahkan pengguna untuk memvisualisasikan data langsung dari DataFrame. Meskipun Matplotlib juga mendukung DataFrame Pandas, Seaborn menyediakan interface yang lebih intuitif.
  • Kustomisasi: sebagai library dasar, Matplotlib memberikan kontrol lebih besar kepada analyst dalam hal kustomisasi. Semenetara itu, Seaborn mengoptimalkan untuk kasus penggunaan umum, tetapi mungkin tidak sefleksibel Matplotlib untuk kebutuhan kustomisasi yang sangat spesifik.

Dalam prakteknya, banyak data analyst menggunakan keduanya secara bersamaan. Seaborn untuk visualisasi cepat yang menarik dan informatif, sementara Matplotlib untuk kustomisasi lebih lanjut atau jenis visualisasi yang lebih kompleks.

Instalasi Seaborn

Berikut langkah-langkah menginstal Seaborn menggunakan PIP:

#1 Persiapkan environment kerja Python

Sebelum menginstal Seaborn, pastikan kamu sudah memiliki Python dan PIP terinstal di komputermu. Jika belum, kamu bisa mendownload dan menginstal Python dari website resminya.

Saat menginstal Python, PIP biasanya sudah termasuk dalam paket instalasi.

#2 Instalasi Seaborn

Setelah memastikan PIP berfungsi dengan baik, buka terminal atau command prompt dan ketik perintah berikut:

pip install seaborn

Tunggu beberapa saat sampai proses instalasi selesai. PIP akan mengunduh dan menginstal Seaborn beserta semua dependensinya.

#3 Mengatur environment Kerja Python

Setelah Seaborn terinstal, kamu bisa mulai mengatur environment kerja Python di perangkatmu. Pertama, buat sebuah file Python baru atau buka interpreter Python interaktif. Kemudian, impor library yang diperlukan.

Untuk menggunakan Seaborn, kamu juga perlu mengimpor Matplotlib karena Seaborn dibangun di atasnya. Berikut cara mengimpornya:

Cara Memuat Data untuk Visualisasi

Sebelum memulai visualisasi data dengan Seaborn, langkah pertama yang harus dilakukan adalah memuat data yang ingin divisualisasikan.

Seaborn menyediakan beberapa cara untuk melakukan ini:

#1 Menggunakan dataset sampel dari Seaborn

Salah satu fitur menarik dari Seaborn adalah kemampuannya memuat dataset sampel yang sudah disediakan. Fitur ini berguna jika kamu ingin belajar atau bereksperimen.

Untuk memuat dataset sampel, kamu bisa menggunakan fungsi load_dataset(). Misalnya, untuk memuat dataset yang bernama 'tips', kamu bisa mengetik perintah berikut:

Fungsi head() dari Pandas digunakan untuk menampilkan lima baris pertama dari dataset..

#2 Menggunakan data yang sudah ada

Jika kamu memiliki data sendiri, misalnya dalam format CSV, kamu bisa memanfaatkan library Pandas untuk memuatnya.

Setelah data dimuat ke dalam DataFrame Pandas, kamu akan lebih mudah memvisualisasikannya dengan Seaborn. Berikut contoh cara memuat data dari file CSV:

Cara Membuat Berbagai Jenis Plot dengan Seaborn

Seaborn menawarkan berbagai jenis plot yang dapat membantu kamu dalam menganalisis dan mempresentasikan data. Berikut beberapa jenis plot Seaborn sekaligus cara membuatnya:

Scatter plot

Plot ini berguna untuk menampilkan hubungan antara dua variabel kontinu.

Line plot

Bar plot

Plot jenis ini berguna untuk membandingkan kuantitas variabel kategorikal.

Histogram

Histogram dipakai untuk menampilkan distribusi dari satu variabel kontinu.

Box plot

Box plot menunjukkan distribusi data melalui kuartil dan dapat mengidentifikasi pencilan.

Heatmap

Heatmap berguna untuk menampilkan korelasi atau hubungan antara dua variabel kategorikal.

{{COMPONENT_IDENTIFIER}}

Cara Mengubah Tampilan Plot dengan Seaborn

Berikut beberapa cara mengubah tampilan plot dengan Seaborn:

  • Mengubah warna plot: Seaborn memiliki palet warna beragam yang dapat kamu gunakan untuk mempercantik plot. Misalnya, jika kamu ingin mengubah warna scatter plot, gunakan perintah berikut:
  • Menambahkan dan mengkustomisasi label: label sangat penting untuk memastikan bahwa audiens memahami informasi yang disajikan. Berikut perintah untuk menggunakannya:
  • Mengubah style plot: Seaborn memungkinkan kamu mengubah style backround plot dengan fungsi set_style().
  • Menyesuaikan ukuran dan bentuk titik: pada scatter plot, kamu bisa mengubah ukuran dan bentuk titik berdasarkan variabel tertentu.
  • Menggunakan tema: Seaborn menyediakan beberapa tema bawaan yang dapat kamu gunakan untuk mengubah tampilan keseluruhan plot dengan mudah.

Dengan mengkombinasikan berbagai fitur kustomisasi di atas, kamu bisa membuat visualisasi yang tidak hanya informatif, tetapi juga mudah dipahami oleh audiens.

Cara Membuat Heatmap dan Korelasi dengan Seaborn

Heatmap adalah salah satu jenis visualisasi untuk menampilkan hubungan antara dua variabel kategorikal atau untuk menampilkan korelasi antara variabel-variabel dalam dataset.

Pada konteks analisis data, heatmap sering dipakai untuk memvisualisasikan matriks korelasi antara variabel.

Berikut cara membuat heatmap untuk matriks korelasi.

Pertama-tama, kamu perlu menghitung matriks korelasi dari dataset menggunakan Pandas. Kemudian, kamu bisa memvisualisasikannya dengan Seaborn.

Dalam kode di atas, data.corr() menghitung matriks korelasi dari dataset. Parameter annot=True memastikan bahwa nilai korelasi ditampilkan di dalam sel heatmap. Sementara cmap digunakan untuk menentukan palet warna.

Jika kamu ingin mengubah format annotation pada heatmap, kamu bisa menambahkan parameter fmt. Contoh:

Dengan menambahkan fmt='.4f', nilai korelasi akan ditampilkan dengan empat angka desimal.

Selain membuat matriks korelasi, heatmap juga memungkinkan kamu dengan cepat mengidentifikasi hubungan antara variabel.

Warna yang lebih hangat (misalnya, merah atau oranye) biasanya menunjukkan korelasi positif yang kuat, sedangkan warna yang lebih dingin (seperti biru) menunjukkan korelasi negatif. Jika sel dalam heatmap berwarna netral atau mendekati nol, menunjukkan tidak ada korelasi yang signifikan antara dua variabel tersebut.

Dengan memahami pola warna ini, kamu lebih cepat menentukan variabel mana yang memiliki hubungan kuat atau lemah satu sama lain.

FAQ (Frequently Ask Question)

Bagaimana cara menambahkan judul dan label ke plot Seaborn?

Meskipun Seaborn memfasilitasi pembuatan plot, untuk menambahkan judul dan label, kamu biasanya akan menggunakan fungsi dari Matplotlib seperti plt.title(), plt.xlabel(), dan plt.ylabel().

Dapatkah menggunakan Seaborn dengan Jupyter Notebook atau Google Colab?

Ya, Seaborn dapat dengan mudah digunakan dalam Jupyter Notebook, Google Colab, atau platform lain yang mendukung eksekusi kode Python.

Penutup

Seaborn Python adalah alat visualisasi data yang menggabungkan kekuatan teknis dengan estetika visual untuk menghadirkan wawasan mendalam dari dataset.

Sepanjang pembahasan di atas, kita telah menyelami berbagai aspek dari Seaborn, mulai dari instalasi, memuat data, sampai kustomisasi plot untuk memaksimalkan informasi yang disampaikan. Dengan kemampuannya untuk memvisualisasikan hubungan antar variabel, mengidentifikasi tren, serta menampilkan distribusi data dengan cara yang mudah dipahami, Seaborn telah membuktikan sebagai library yang harus dipelajari.

RevoU Staff
Kickstart your career in tech with RevoU!
Menu