top of page

Box Plot

Box plot adalah grafik visualisasi data yang digunakan dalam statistik untuk menunjukkan distribusi data.

data-analyst

Apa itu Box Plot?

pengertian bo plot

Box plot adalah grafik visualisasi data yang digunakan dalam statistik untuk menunjukkan distribusi data.

Dikenal juga sebagai 'box and whisker plot', metode ini memberikan gambaran visual mengenai rentang data, termasuk nilai minimum, kuartil pertama (Q1), median, kuartil ketiga (Q3), dan nilai maksimum.

Uniknya, box plot juga menonjolkan 'whiskers' yang mengindikasikan variasi di luar kuartil atas dan bawah, serta menunjukkan adanya outlier atau data yang jauh berbeda dari lainnya.

Dengan box plot, seseorang bisa dengan cepat memahami seberapa tersebar data tersebut, apakah simetris, dan seberapa ketat kelompok data tersebut berkumpul.

Tujuan Box Plot

Tujuan utama dari box plot adalah untuk memberikan gambaran visual yang efektif tentang distribusi data. Berikut adalah beberapa tujuan spesifik dari penggunaan box plot:

  • Mengidentifikasi rentang data: box plot menunjukkan rentang antara nilai minimum dan maksimum dalam suatu set data, memberikan pemahaman cepat tentang seberapa luas data tersebut tersebar.
  • Memvisualisasikan kuartil: box plot membagi data menjadi empat bagian (kuartil), sehingga memudahkan untuk melihat median (kuartil kedua) dan membandingkan kuartil pertama dan ketiga. Hal ini membantu dalam memahami seberapa terpusat atau tersebar data tersebut.
  • Mendeteksi outlier: dengan 'whiskers' atau garis yang membentang dari kotak, box plot menunjukkan variasi di luar kuartil atas dan bawah. Data yang berada di luar whiskers sering dianggap sebagai outlier, memberikan indikasi tentang adanya nilai yang sangat berbeda dari keseluruhan data.
  • Membandingkan distribusi: box plot juga berguna untuk membandingkan distribusi antara beberapa kelompok atau kategori. Hal ini memudahkan dalam melihat perbedaan median, rentang, dan variasi antara kelompok-kelompok tersebut.

Contoh Box Plot

Misalkan analyst memiliki data nilai ujian matematika dari sebuah kelas yang terdiri dari 10 siswa. Nilai mereka adalah sebagai berikut: 50, 55, 60, 65, 70, 75, 80, 85, 90, 95.

Langkah pertama yaitu mengurutkan data dari nilai terkecil ke terbesar: 50, 55, 60, 65, 70, 75, 80, 85, 90, 95.

Kemudian, tentukan kelima angka penting dalam box plot:

  • Minimum: nilai terkecil dalam data, yaitu 50.
  • Kuartil pertama (Q1): median dari separuh pertama data. Dalam kasus ini, median dari 50, 55, 60, 65, 70 adalah 60.
  • Median (Q2): Nilai tengah dari data. Dengan 10 data, median adalah rata-rata dari nilai ke-5 dan ke-6, yaitu (70 + 75) / 2 = 72.5.
  • Kuartil ketiga (Q3): median dari separuh kedua data. Dalam kasus ini, median dari 75, 80, 85, 90, 95 adalah 85.
  • Maksimum: nilai terbesar dalam data, yaitu 95.

Informasi di atas bisa digunakan untuk mulai menggambar box plot:

  • Kotak di tengah digambar dari Q1 (60) ke Q3 (85).
  • Garis di dalam kotak menunjukkan median (72.5).
  • 'Whiskers' atau garis horizontal ditarik dari minimum (50) ke Q1 dan dari Q3 ke maksimum (95).
contoh tabel box plot

FAQ (Frequently Ask Question)

Kapan menggunakan box plot?

Box plot sangat berguna saat analyst memerlukan informasi lebih dari sekadar ukuran tendensi sentral (rata-rata, median, dan modus) dari suatu set data.

Berikut beberapa situasi spesifik di mana box plot diperlukan:

  • Saat ingin memahami variabilitas data: box plot dapat menggambarkan variabilitas atau dispersi semua titik data dalam suatu set, memberikan indikasi yang tepat tentang adanya outlier dan seberapa simetris data tersebut.
  • Membandingkan distribusi antar kelompok: box plot efektif diterapkan untuk membandingkan distribusi antara banyak kelompok atau set data. Hal ini dikarenakan box plot membutuhkan ruang lebih sedikit dibandingkan histogram atau density plot.
  • Analisis data eksploratif: box plot sering dipakai dalam analisis data eksploratif untuk mendapatkan pemahaman awal tentang distribusi data. Proses ini membantu mengidentifikasi tren, anomali, dan karakteristik penting dari data.
  • Studi outlier: box plot memudahkan identifikasi outlier atau nilai yang jauh berbeda dari sebagian besar data. Ini penting dalam analisis data untuk menentukan apakah outlier tersebut harus diperhatikan atau dikecualikan dari analisis.
  • Saat menggunakan analisis data multivariat: dalam analisis data multivariat, box plot dapat dimanfaatkan untuk memvisualisasikan distribusi variabel-variabel dan membandingkannya secara bersamaan.
  • Saat ada data tidak normal: box plot sangat berguna ketika distribusi data tidak normal atau ketika ukuran sampel tidak cukup besar untuk menentukan distribusi normal.
  • Saat ingin mengambil keputusan: dalam konteks bisnis, box plot bisa membantu mengambil keputusan dengan menyediakan gambaran cepat tentang variasi dan tendensi data.

Mulai karirmu dalam

data-analyst

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 12.500+ member selamanya untuk support perkembangan karir kamu!

bottom of page