Cara Membuat Scatter Plot di Python

Pelajari cara membuat scatter plot di Python lengkap dengan contohnya, di sini!
RevoU Staff
March 31, 2024
5
min read

Mau Belajar

Data Analytics

?

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!
DAFTAR FULL PROGRAMCOBA COURSE GRATIS

Overview

Scatter plot adalah jenis grafik untuk menampilkan dan membandingkan dua variabel data, sering kali untuk mengidentifikasi pola atau hubungan antara mereka. Dalam Python, scatter plot dapat dengan mudah dibuat menggunakan library seperti Matplotlib, memungkinkan analisis visual yang mendalam dan intuitif dari dataset.

Mengungkap misteri di balik kumpulan data bisa serupa dengan mengurai benang kusut.

Namun dengan scatter plot di Python, proses tersebut menjadi lebih mudah dan menarik. Scatter plot adalah salah satu jenis visualisasi data yang paling efektif untuk menampilkan hubungan antar variabel.

Dengan Python, kamu dapat menghasilkan scatter plot yang tidak hanya akurat secara matematis, tetapi juga memukau secara visual.

Artikel ini akan membimbingmu melalui proses pembuatan scatter plot di Python, mulai dari persiapan data sampai penyesuaian estetika plot, membantumu menggali insight dari data dengan cara yang paling efisien. Mari kita mulai!

Kegunaan Matplotlib untuk Membuat Scatter Plot di Python

Matplotlib merupakan salah satu library visualisasi data paling populer dan banyak digunakan dalam ekosistem Python.

Dengan kemampuannya yang fleksibel dan konfigurasi luas, Matplotlib bisa menghasilkan berbagai jenis grafik dan plot, termasuk scatter plot. Berikut beberapa kegunaan utama Matplotlib dalam membuat scatter plot di Python:

  • Visualisasi hubungan antar variabel: visualisasi hubungan antar variabel menggunakan scatter plot berguna untuk mengeksplorasi dan memahami korelasi antara dua variabel. Dengan Matplotlib, kamu memplot dua set data pada sumbu x dan y untuk melihat bagaimana satu variabel berhubungan dengan variabel lainnya.
  • Identifikasi pola, tren, dan outlier: melalui scatter plot yang dibuat dengan Matplotlib, kamu dapat mengidentifikasi pola dan tren dalam data, serta menemukan outlier atau nilai yang menyimpang dari distribusi umum.
  • Analisis distribusi data: scatter plot membantu untuk melihat distribusi data secara visual. Dengan Matplotlib, kamu bisa menambahkan elemen seperti garis regresi atau fitting curve untuk membantu menganalisis seberapa baik distribusi data dan memprediksi tren.
  • Kustomisasi plot: kamu dapat mengubah hampir setiap aspek dari scatter plot, termasuk warna titik, ukuran titik, label sumbu, judul plot, dan banyak lagi. Hal ini memudahkan pembuatan visualisasi yang informatif sekaligus menarik secara visual.

Cara Membuat Scatter Plot di Python

Berikut langkah-langkah membuat scatter plot menggunakan Matplotlib:

#1 Instalasi dan impor library

Jika kamu belum memiliki Matplotlib di lingkungan Python, kamu bisa menginstalnya menggunakan pip, yaitu package manager Python. Buka terminal atau command prompt dan jalankan perintah pip install matplotlib.

Setelah terinstal, kamu perlu mengimpor Matplotlib ke dalam script Python. Untuk memudahkan pemanggilan berulang terhadap submodule pyplot, kita bisa menyingkat namanya menjadi plt dengan menggunakan "as" dalam Python sebagai cara aliasing.

#2 Persiapan data

Sebelum membuat scatter plot, kamu perlu menyiapkan data yang akan divisualisasikan. Data harus terdiri dari dua variabel; satu untuk sumbu x dan satu lagi untuk sumbu y. Data bisa dalam bentuk list, array NumPy, atau kolom dari DataFrame Pandas.

Tips memilih data:

  • Pastikan data bersih dan tidak mengandung nilai yang hilang (missing values).
  • Pilih variabel yang ingin kamu bandingkan atau analisis hubungannya.
  • Pastikan variabel yang dipilih adalah variabel numerik, karena scatterplot hanya dapat mencari hubungan antar variabel yang bersifat numerik.

#3 Membuat scatter plot

Untuk membuat scatter plot, gunakan fungsi plt.scatter() dari Matplotlib. Berikut contoh kode untuk membuat scatter plot sederhana:

Output:

#4 Menyesuaikan tampilan plot

Agar scatter plot lebih informatif, tambahkan judul, label sumbu, dan legend.

Tips menyesuaikan estetika plot:

  • Gunakan parameter color untuk mengubah warna marker.
  • Gunakan parameter s untuk mengubah ukuran marker.

#5 Menyimpan dan menampilkan plot

Setelah scatter plot dibuat dan disesuaikan, simpan ke dalam file gambar atau tampilkan di layar.

Untuk menyimpan scatter plot ke dalam file, gunakan fungsi plt.savefig() sebelum plt.show():

plt.savefig('scatterplot.png')

Sementara untuk menampilkan plot di layar, cukup panggil plt.show() setelah semua pengaturan plot selesai.

FAQ (Frequently Ask Question)

Bagaimana cara menambahkan garis tren ke scatter plot di Python?

Menambahkan garis tren ke scatter plot di Python adalah cara untuk memvisualisasikan hubungan antara dua set data. Ini bisa dilakukan dengan menggunakan kombinasi dari NumPy, sebuah library yang menyediakan dukungan untuk array dan operasi matematika, serta Matplotlib untuk visualisasi. Berikut caranya:

  • Impor library yang diperlukan: pastikan kamu telah mengimpor Matplotlib dan NumPy ke dalam script Python. Jika belum terinstal, kamu bisa menginstalnya menggunakan pip (pip install matplotlib numpy).
  • Persiapkan data: siapkan data yang ingin kamu plot. Biasanya, kamu akan memiliki dua array atau list: satu untuk nilai x (variabel independen) dan satu lagi untuk nilai y (variabel dependen).
  • Buat scatter plot: gunakan Matplotlib untuk membuat scatter plot dari data kamu.
  • Hitung garis tren: gunakan np.polyfit() untuk menghitung parameter garis tren. Fungsi ini mengembalikan koefisien dari polinomial fitting terbaik yang sesuai dengan data. Untuk garis lurus, gunakan derajat polinomial 1.
  • Tambahkan garis tren ke plot: setelah memiliki fungsi polinomial untuk garis tren, gunakan ini untuk menghitung nilai y tren berdasarkan x dan tambahkan garis tren ke plot kamu dengan plt.plot().
  • Menampilkan plot: akhirnya, tampilkan scatter plot dengan garis tren menggunakan plt.show().

Bagaimana cara menambahkan label ke setiap titik di scatter plot Python?

Menambahkan label ke setiap titik di scatter plot Python memberikan informasi tambahan tentang setiap titik data, sehingga visualisasi lebih informatif. Setelah membuat scatter plot, berikut cara menambahkan label ke setiap titiknya:

  • Gunakan fungsi text() untuk menambahkan label ke setiap titik. Kamu bisa mengatur posisi teks relatif terhadap titik data dengan menggunakan parameter textcoords dan xytext. Untuk setiap titik data, panggil text() dengan koordinat titik dan label yang sesuai.
  • Parameter ha (horizontal alignment) dan va (vertical alignment) dipakai untuk mengatur posisi teks relatif terhadap koordinat titik. Nilai right dan bottom berarti teks akan diposisikan sedikit ke kanan dan bawah dari titik data.
  • Setelah menambahkan semua label, gunakan plt.show() untuk menampilkan scatter plot.
RevoU Staff
Kickstart your career in tech with RevoU!

Masih ragu? Coba dulu 3 hari, GRATIS
di Full-Stack Trial Class!

Rasakan pengalaman belajar di RevoU Full-Stack Program: Kelas 100% LIVE, Mini portofolio lewat hands-on assignment, Bimbingan Team Lead & small group discussion. Kalau cocok, kamu bisa lanjut daftar Full Program dengan kesempatan Fast-Track (skip semua tes seleksi masuk, langsung ke tahap akhir!)

Masih ragu? Coba dulu 3 hari, GRATIS
di Full-Stack Trial Class!

Rasakan pengalaman belajar di RevoU Full-Stack Program: Kelas 100% LIVE, Mini portofolio lewat hands-on assignment, Bimbingan Team Lead & small group discussion. Kalau cocok, kamu bisa lanjut daftar Full Program dengan kesempatan Fast-Track (skip semua tes seleksi masuk, langsung ke tahap akhir!)

Masih ragu? Coba dulu 3 hari, GRATIS
di Full-Stack Trial Class!

Rasakan pengalaman belajar di RevoU Full-Stack Program: Kelas 100% LIVE, Mini portofolio lewat hands-on assignment, Bimbingan Team Lead & small group discussion. Kalau cocok, kamu bisa lanjut daftar Full Program dengan kesempatan Fast-Track (skip semua tes seleksi masuk, langsung ke tahap akhir!)

Artikel Lainnya

Mau belajar

Data Analytics

?

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!
Menu

Mulai karirmu dalam

Data Analytics

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!

Mau Belajar

Data Analytics

?

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!

DAFTAR FULL PROGRAM

Mau Belajar

Data Analytics

?

Cara Membuat Scatter Plot di Python

Pelajari cara membuat scatter plot di Python lengkap dengan contohnya, di sini!
RevoU Staff
March 31, 2024
5
min read

Overview

Scatter plot adalah jenis grafik untuk menampilkan dan membandingkan dua variabel data, sering kali untuk mengidentifikasi pola atau hubungan antara mereka. Dalam Python, scatter plot dapat dengan mudah dibuat menggunakan library seperti Matplotlib, memungkinkan analisis visual yang mendalam dan intuitif dari dataset.

Mengungkap misteri di balik kumpulan data bisa serupa dengan mengurai benang kusut.

Namun dengan scatter plot di Python, proses tersebut menjadi lebih mudah dan menarik. Scatter plot adalah salah satu jenis visualisasi data yang paling efektif untuk menampilkan hubungan antar variabel.

Dengan Python, kamu dapat menghasilkan scatter plot yang tidak hanya akurat secara matematis, tetapi juga memukau secara visual.

Artikel ini akan membimbingmu melalui proses pembuatan scatter plot di Python, mulai dari persiapan data sampai penyesuaian estetika plot, membantumu menggali insight dari data dengan cara yang paling efisien. Mari kita mulai!

Kegunaan Matplotlib untuk Membuat Scatter Plot di Python

Matplotlib merupakan salah satu library visualisasi data paling populer dan banyak digunakan dalam ekosistem Python.

Dengan kemampuannya yang fleksibel dan konfigurasi luas, Matplotlib bisa menghasilkan berbagai jenis grafik dan plot, termasuk scatter plot. Berikut beberapa kegunaan utama Matplotlib dalam membuat scatter plot di Python:

  • Visualisasi hubungan antar variabel: visualisasi hubungan antar variabel menggunakan scatter plot berguna untuk mengeksplorasi dan memahami korelasi antara dua variabel. Dengan Matplotlib, kamu memplot dua set data pada sumbu x dan y untuk melihat bagaimana satu variabel berhubungan dengan variabel lainnya.
  • Identifikasi pola, tren, dan outlier: melalui scatter plot yang dibuat dengan Matplotlib, kamu dapat mengidentifikasi pola dan tren dalam data, serta menemukan outlier atau nilai yang menyimpang dari distribusi umum.
  • Analisis distribusi data: scatter plot membantu untuk melihat distribusi data secara visual. Dengan Matplotlib, kamu bisa menambahkan elemen seperti garis regresi atau fitting curve untuk membantu menganalisis seberapa baik distribusi data dan memprediksi tren.
  • Kustomisasi plot: kamu dapat mengubah hampir setiap aspek dari scatter plot, termasuk warna titik, ukuran titik, label sumbu, judul plot, dan banyak lagi. Hal ini memudahkan pembuatan visualisasi yang informatif sekaligus menarik secara visual.

Cara Membuat Scatter Plot di Python

Berikut langkah-langkah membuat scatter plot menggunakan Matplotlib:

#1 Instalasi dan impor library

Jika kamu belum memiliki Matplotlib di lingkungan Python, kamu bisa menginstalnya menggunakan pip, yaitu package manager Python. Buka terminal atau command prompt dan jalankan perintah pip install matplotlib.

Setelah terinstal, kamu perlu mengimpor Matplotlib ke dalam script Python. Untuk memudahkan pemanggilan berulang terhadap submodule pyplot, kita bisa menyingkat namanya menjadi plt dengan menggunakan "as" dalam Python sebagai cara aliasing.

#2 Persiapan data

Sebelum membuat scatter plot, kamu perlu menyiapkan data yang akan divisualisasikan. Data harus terdiri dari dua variabel; satu untuk sumbu x dan satu lagi untuk sumbu y. Data bisa dalam bentuk list, array NumPy, atau kolom dari DataFrame Pandas.

Tips memilih data:

  • Pastikan data bersih dan tidak mengandung nilai yang hilang (missing values).
  • Pilih variabel yang ingin kamu bandingkan atau analisis hubungannya.
  • Pastikan variabel yang dipilih adalah variabel numerik, karena scatterplot hanya dapat mencari hubungan antar variabel yang bersifat numerik.

#3 Membuat scatter plot

Untuk membuat scatter plot, gunakan fungsi plt.scatter() dari Matplotlib. Berikut contoh kode untuk membuat scatter plot sederhana:

Output:

#4 Menyesuaikan tampilan plot

Agar scatter plot lebih informatif, tambahkan judul, label sumbu, dan legend.

Tips menyesuaikan estetika plot:

  • Gunakan parameter color untuk mengubah warna marker.
  • Gunakan parameter s untuk mengubah ukuran marker.

#5 Menyimpan dan menampilkan plot

Setelah scatter plot dibuat dan disesuaikan, simpan ke dalam file gambar atau tampilkan di layar.

Untuk menyimpan scatter plot ke dalam file, gunakan fungsi plt.savefig() sebelum plt.show():

plt.savefig('scatterplot.png')

Sementara untuk menampilkan plot di layar, cukup panggil plt.show() setelah semua pengaturan plot selesai.

FAQ (Frequently Ask Question)

Bagaimana cara menambahkan garis tren ke scatter plot di Python?

Menambahkan garis tren ke scatter plot di Python adalah cara untuk memvisualisasikan hubungan antara dua set data. Ini bisa dilakukan dengan menggunakan kombinasi dari NumPy, sebuah library yang menyediakan dukungan untuk array dan operasi matematika, serta Matplotlib untuk visualisasi. Berikut caranya:

  • Impor library yang diperlukan: pastikan kamu telah mengimpor Matplotlib dan NumPy ke dalam script Python. Jika belum terinstal, kamu bisa menginstalnya menggunakan pip (pip install matplotlib numpy).
  • Persiapkan data: siapkan data yang ingin kamu plot. Biasanya, kamu akan memiliki dua array atau list: satu untuk nilai x (variabel independen) dan satu lagi untuk nilai y (variabel dependen).
  • Buat scatter plot: gunakan Matplotlib untuk membuat scatter plot dari data kamu.
  • Hitung garis tren: gunakan np.polyfit() untuk menghitung parameter garis tren. Fungsi ini mengembalikan koefisien dari polinomial fitting terbaik yang sesuai dengan data. Untuk garis lurus, gunakan derajat polinomial 1.
  • Tambahkan garis tren ke plot: setelah memiliki fungsi polinomial untuk garis tren, gunakan ini untuk menghitung nilai y tren berdasarkan x dan tambahkan garis tren ke plot kamu dengan plt.plot().
  • Menampilkan plot: akhirnya, tampilkan scatter plot dengan garis tren menggunakan plt.show().

Bagaimana cara menambahkan label ke setiap titik di scatter plot Python?

Menambahkan label ke setiap titik di scatter plot Python memberikan informasi tambahan tentang setiap titik data, sehingga visualisasi lebih informatif. Setelah membuat scatter plot, berikut cara menambahkan label ke setiap titiknya:

  • Gunakan fungsi text() untuk menambahkan label ke setiap titik. Kamu bisa mengatur posisi teks relatif terhadap titik data dengan menggunakan parameter textcoords dan xytext. Untuk setiap titik data, panggil text() dengan koordinat titik dan label yang sesuai.
  • Parameter ha (horizontal alignment) dan va (vertical alignment) dipakai untuk mengatur posisi teks relatif terhadap koordinat titik. Nilai right dan bottom berarti teks akan diposisikan sedikit ke kanan dan bawah dari titik data.
  • Setelah menambahkan semua label, gunakan plt.show() untuk menampilkan scatter plot.
RevoU Staff
Kickstart your career in tech with RevoU!
Menu