Missing Value

Keberadaan missing value bisa berdampak signifikan terhadap hasil analisis, menyebabkan bias atau ketidakakuratan pada analisis statistik.

Data Analytics

Mau Belajar

Data Analytics

GRATIS?

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!

IKUT KURSUS GRATIS

Mau Belajar

Data Analytics

GRATIS?

Apa itu Missing Value?

Keberadaan missing value bisa berdampak signifikan terhadap hasil analisis, menyebabkan bias atau ketidakakuratan pada analisis statistik.

Missing value adalah data yang hilang atau tidak tercatat dalam suatu dataset.

Hal ini terjadi karena kesalahan pencatatan, data yang tidak tersedia, atau responden yang tidak memberikan informasi. 

Keberadaan missing value bisa berdampak signifikan terhadap hasil analisis, menyebabkan bias atau ketidakakuratan pada analisis statistik.

Faktor Penyebab Missing Value

Faktor-faktor yang menyebabkan missing value dalam dataset antara lain:

  1. Kesalahan pencatatan: human error saat memasukkan data bisa menyebabkan data hilang atau tidak tercatat dengan benar.
  2. Tidak ada jawaban responden: dalam survei, responden mungkin tidak menjawab beberapa pertanyaan, sehingga data tersebut tidak tersedia.
  3. Tidak mendapatkan data: informasi yang tidak bisa diperoleh karena berbagai alasan, seperti alat rusak atau tidak ada akses ke data tersebut.
  4. Kerusakan data: data bisa hilang atau rusak karena masalah teknis, seperti kegagalan sistem atau file yang korup.
  5. Alasan etis atau privasi: beberapa data mungkin tidak dicatat atau dihilangkan karena alasan etis atau privasi, misalnya informasi medis yang sensitif.

Jenis-jenis Missing Value

Ada tiga jenis missing value yang umum dalam analisis data:

  • Missing Completely at Random (MCAR): data yang hilang secara acak dan tidak berhubungan dengan data lainnya.
  • Missing at Random (MAR): Kehilangan data yang berhubungan dengan nilai variabel lain dalam dataset.
  • Missing Not at Random (MNAR): data yang hilang karena alasan spesifik yang mungkin tidak diketahui.

Contoh Missing Value

Contoh missing values dalam dataset adalah:

  1. Data demografi: saat responden tidak mengisi kolom umur atau pendapatan.
  2. Survei kesehatan: pasien yang tidak memberikan informasi medis tertentu.
  3. Penjualan produk: transaksi yang tidak mencatat jumlah penjualan atau tanggal transaksi.
  4. Penelitian cuaca: data suhu yang hilang karena kerusakan alat pengukur.

FAQ (Frequently Asked Question)

Apa saja metode penanganan missing value?

Berikut beberapa metode penanganan missing values dalam dataset:

  • Penghapusan data: menggunakan fungsi ‘dropna()’ untuk menghapus baris atau kolom dengan nilai yang hilang. Metode ini sederhana tapi bisa menyebabkan kehilangan informasi penting.
  • Imputasi mean atau median: menggantikan value yang hilang dengan rata-rata atau median. Cocok untuk data numerik dengan distribusi normal.
  • Imputasi sampel acak: menggantikan value yang hilang dengan nilai acak dari data yang ada, hal ini bisa membantu menjaga variasi data.
  • Multiple imputation: menggunakan metode Multiple Imputation by Chained Equations (MICE) yang mempertimbangkan hubungan antar variabel untuk estimasi yang lebih akurat.

Kata kunci lainnya

Mulai karirmu dalam

Data Analytics

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!
ikut kursus gratis
Menu