Histogram
Histogram adalah jenis grafik yang menampilkan distribusi frekuensi dari suatu variabel numerik.
data-analyst
Apa itu Histogram?
Histogram adalah jenis grafik yang menampilkan distribusi frekuensi dari suatu variabel numerik. Setiap bar (batang) pada histogram mencakup rentang nilai tertentu (dikenal sebagai bin atau kelas) dan tinggi bar yang menunjukkan frekuensi data dalam rentang tersebut.
Bayangkan hasil tes dari sekelompok siswa. Histogram menunjukkan sebagian besar siswa mendapatkan skor antara 70 sampai 80, sedangkan hanya sedikit yang mendapatkan skor di atas 90. Histogram dengan cepat membantu melihat bagaimana skor tersebut didistribusikan, apakah sebagian besar siswa mendapatkan skor tinggi, rendah, atau mungkin skor tersebar merata di seluruh rentang.
Selain itu, histogram juga membantu mengidentifikasi pola tertentu dalam data. Misalnya, bentuk bar histogram memberikan informasi tentang seberapa seragam distribusi data, apakah ada kecenderungan tertentu, atau apakah ada outlier. Hal ini berguna dalam analisis statistik untuk memahami karakteristik data.
Namun, saat membuat histogram, penting untuk memilih jumlah bin yang tepat. Jika terlalu banyak bin, distribusi data cenderung sulit diinterpretasikan. Sebaliknya, jika terlalu sedikit bin, detail penting mungkin hilang. Oleh karena itu, memilih ukuran bin yang sesuai adalah kunci untuk membuat histogram yang informatif.
Dalam pekerjaan sehari-hari seorang data analyst, histogram biasanya dimanfaatkan untuk menganalisis waktu respons sistem dukungan, memahami distribusi umur pelanggan, atau mengevaluasi kinerja produk.
Kegunaan Histogram
Dirangkum dari Tech Target dan Jaspersoft, berikut beberapa kegunaan histogram:
Mengidentifikasi distribusi data
Salah satu kegunaan utama histogram adalah memahami bagaimana data didistribusikan. Dengan melihat bentuk dan lebar bar (batang) pada histogram, analyst dapat lebih cepat menentukan apakah data memiliki distribusi normal, miring ke kiri, miring ke kanan, atau memiliki pola distribusi lainnya.
Mendeteksi outlier
Histogram memungkinkan analyst dengan mudah mendeteksi outlier atau nilai yang jauh dari kumpulan data utama. Outlier ini bisa menjadi indikasi kesalahan dalam pengumpulan data atau fenomena khusus yang perlu diteliti lebih lanjut.
Memahami variabilitas data
Histogram memberikan gambaran visual tentang seberapa besar variasi dalam kumpulan data. Hal ini penting dalam banyak pengaplikasian (seperti kontrol kualitas) di mana variabilitas berlebihan dapat menunjukkan masalah dalam proses produksi.
Menganalisis tren
Dengan membandingkan histogram dari periode waktu yang berbeda, analyst bisa mengidentifikasi tren dalam data. Fungsi ini sangat berguna dalam situasi seperti analisis penjualan atau evaluasi kinerja produk dalam kurun waktu tertentu.
Optimasi pengambilan keputusan
Memahami distribusi dan variasi data melalui histogram membantu bisnis membuat keputusan lebih tepat dan berdasarkan data. Misalnya, berdasarkan tren penjualan yang dilihat dari histogram, bisnis memutuskan untuk meningkatkan produksi barang tertentu.
Membandingkan kumpulan data
Histogram memungkinkan untuk membandingkan secara visual antara dua atau lebih kumpulan data. Hal ini bisa dimanfaatkan untuk membandingkan kinerja dua produk, dua metode produksi, atau dua periode waktu.
Contoh Histogram
Toko kosmetik Jelita memiliki data penjualan toner selama 10 hari:
Data di atas akan ditampilkan dalam histogram untuk mengetahui distribusi frekuensi penjualan produk toner selama 10 hari.
Sebelumnya, analyst harus menentukan interval kelas atau "bin" untuk data tersebut. Analyst memilih interval kelas dengan lebar 5 unit. Dengan interval kelas 5 unit, data tersebut dapat dibagi menjadi beberapa kelas sebagai berikut:
- 45-49 unit
- 50-54 unit
- 55-59 unit
- 60-64 unit
Menggunakan data frekuensi di atas, histogramnya akan terlihat seperti ini:
- 45-49 unit: bar dengan tinggi mencapai angka 3 (karena ada 3 hari dengan penjualan dalam kisaran ini).
- 50-54 unit: bar dengan tinggi mencapai angka 4.
- 55-59 unit: bar dengan tinggi mencapai angka 2.
- 60-64 unit: bar dengan tinggi mencapai angka 1.
Dari histogram tersebut, dapat dilihat bahwa penjualan paling sering berada di kisaran 50-54 unit selama periode 10 hari.
FAQ (Frequently Asked Question)
Apa hubungan histogram dan poligon frekuensi?
Baik histogram maupun poligon frekuensi, keduanya merupakan tool visualisasi yang dipakai untuk menampilkan distribusi frekuensi dari kumpulan data.
Histogram ditampilkan dalam bentuk bar (batang) vertikal berdampingan, di mana setiap bar mewakili frekuensi dari suatu kelas atau rentang data. Di sisi lain, poligon frekuensi adalah grafik garis yang menghubungkan titik-titik tengah dari setiap batang pada histogram, memberikan gambaran kontinu tentang distribusi data.
Meskipun sama-sama memberikan informasi yang sama mengenai distribusi frekuensi, cara penyajian keduanya berbeda.
Histogram lebih fokus pada visualisasi frekuensi untuk setiap kelas data secara individual, sedangkan poligon frekuensi menekankan pada tren keseluruhan atau pola distribusi data. Dalam banyak kasus, poligon frekuensi digunakan bersamaan dengan histogram untuk memberikan gambaran lebih jelas tentang karakteristik data.
Sebagai contoh, jika data memiliki beberapa puncak atau lembah, poligon frekuensi dapat membantu meng-highlight pola tersebut dengan lebih jelas daripada hanya menggunakan histogram saja.
Mulai karirmu dalam
data-analyst
Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!