Distribusi Normal
Distribusi normal adalah sebuah distribusi probabilitas yang digambarkan dengan kurva lonceng simetris yang melandai di bagian tepi dan memuncak di bagian tengah.
data-analytics
Apa itu Distribusi Normal?
Berdasarkan Investopedia, distribusi normal adalah sebuah distribusi probabilitas yang digambarkan dengan kurva lonceng simetris yang melandai di bagian tepi dan memuncak di bagian tengah. Tipe distribusi ini biasanya digunakan untuk menggambarkan pola penyebaran data dari variabel kontinu seperti tinggi badan, berat badan, atau tekanan darah.
Distribusi normal berguna untuk menggambarkan seberapa sering sesuatu terjadi dalam rentang tertentu.
Misalnya, jika dilakukan pengukuran tinggi badan suatu populasi yang besar, kemungkinan data yang terkumpul akan mengikuti pola distribusi normal, di mana sebagian besar memiliki tinggi rata-rata, sementara jumlah orang yang sangat pendek atau sangat tinggi lebih sedikit.
Parameter Distribusi Normal
Bentuk kurva lonceng distribusi normal sepenuhnya ditentukan oleh nilai mean dan standar deviasi.
- Mean
Mean, dilambangkan dengan μ, adalah pusat distribusi yang juga dikenal sebagai nilai rata-rata. Dalam distribusi normal, mean adalah nilai di mana penyebaran data berpusat dan berada di puncak kurva.
- Standar deviasi
Standar deviasi, dilambangkan dengan σ, mengukur penyebaran data dari mean dan menunjukkan seberapa banyak data yang menyimpang dari mean. Jika suatu data memiliki standar deviasi yang lebih kecil, berarti datanya mendekati nilai rata-rata dan bentuk kurva semakin sempit.
Sebaliknya, jika standar deviasi datanya besar, berarti datanya lebih tersebar menjauh dari rata-rata dan bentuk kurva melebar . Sebagai contoh, jika standar deviasi dari distribusi normal adalah 5, maka sebagian besar nilai data akan berada dalam plus atau minus ( +/- ) 5 unit dari rata-rata.
Karakteristik Distribusi Normal
Dilansir dari Jim Frost, seorang ahli statistika, ciri utama distribusi normal adalah bentuk kurvanya yang simetris, dan hal itu dapat dilihat dari karakteristik sebagai berikut:
- Kurva berbentuk lonceng
Distribusi normal adalah jenis distribusi probabilitas yang memiliki bentuk simetris menyerupai kurva lonceng. Hal ini menunjukkan bahwa sebagian besar data mengelompok di sekitar rata-rata, dan distribusinya merata di kedua sisi.
- Nilai mean, median, dan modus yang sama
Median merupakan titik tengah distribusi dan modus adalah nilai yang paling sering muncul dalam distribusi. Dalam distribusi normal, mean, median, dan modus sama nilainya karena bentuknya simetris di sekitar mean.
- Tidak cocok untuk data dengan distribusi miring
Data berdistribusi miring memiliki bentuk yang tidak simetris dan tidak cocok untuk pemodelan dengan distribusi normal.
Distribusi miring memiliki ekor yang lebih panjang di satu sisi daripada sisi lainnya, menunjukkan bahwa datanya tidak terdistribusi secara merata. Dengan demikian, data tersebut perlu menggunakan jenis distribusi lain yang sesuai untuk memodelkan data miring.
- Cocok dengan Variabel Kontinu
Distribusi normal cocok untuk memodelkan variabel kontinu, yang merupakan data dengan jumlah nilai yang tak terbatas. Sehingga pemanfaatannya sangat luas untuk menganalisis data di berbagai keperluan, seperti penelitian ekonomi dan ilmu sosial.
Aturan Empiris untuk Distribusi Normal
Aturan empiris distribusi normal, atau diketahui juga sebagai aturan 68-95-99.7, adalah sebuah cara yang bermanfaat untuk memahami distribusi data dalam distribusi normal.
Aturan ini dapat digunakan untuk memperkirakan probabilitas dan membuat prediksi berdasarkan karakteristik populasi. Aturan ini menyatakan bahwa:
- Sekitar 68% dari data termasuk dalam satu standar deviasi dari rata-rata.
- Sekitar 95% data termasuk dalam dua standar deviasi dari rata-rata.
- Sekitar 99,7% data termasuk dalam tiga standar deviasi dari rata-rata.
Persentase tersebut berlaku untuk setiap distribusi normal terlepas dari rata-rata atau standar deviasinya.
Aturan empiris distribusi normal dapat digunakan untuk memperkirakan dengan cepat proporsi data yang berada dalam rentang nilai tertentu tanpa perlu melakukan perhitungan yang rumit atau mencari nilai dalam tabel.
Misalnya, terdapat populasi berdistribusi normal dengan rata-rata 100 dan standar deviasi 10. Proporsi nilai yang berada dalam rentang tertentu dapat diperkirakan menggunakan aturan empiris, yaitu:
- Sekitar 68% dari nilai akan jatuh antara 90 dan 110.
- Sekitar 95% dari nilai akan jatuh antara 80 dan 120.
- Sekitar 99,7% dari nilai akan jatuh antara 70 dan 130.
Contoh Distribusi Normal
Distribusi normal dapat diterapkan pada berbagai fenomena natural seperti tinggi badan, nilai siswa, dan IQ. Berikut ini adalah beberapa contoh yang dapat menggambarkan distribusi normal dengan aturan empiris:
- Nilai Siswa
Nilai ujian siswa bisa jadi terdistribusi secara normal. Mayoritas siswa akan memiliki nilai yang mendekati rata-rata, dan terdapat lebih sedikit siswa yang memiliki nilai yang jauh lebih tinggi atau lebih rendah.
Sebagai contoh, jika nilai tes suatu kelas memiliki distribusi normal dengan rata-rata 75 dan standar deviasi 10, aturan 68-95-99,7 dapat digunakan untuk menentukan bahwa:
- Sekitar 68% siswa mendapat nilai antara 65 dan 85 (satu standar deviasi dari rata-rata)
- Sekitar 95% siswa mendapat nilai antara 55 dan 95 (dua standar deviasi dari rata-rata)
- Sekitar 99,7% siswa mendapat nilai antara 45 dan 105 (tiga standar deviasi dari rata-rata)
- Tinggi Badan
Tinggi manusia dewasa suatu populasi bisa jadi berdistribusi normal karena mayoritas orang memiliki tinggi badan yang mendekati tinggi rata-rata, dan jumlah orang yang sangat tinggi atau sangat pendek lebih sedikit.
Misalnya, tinggi rata-rata pria dewasa dalam populasi tertentu adalah 170 cm dengan standar deviasi 6 cm. Jika tinggi badan populasi tersebut berdistribusi normal, dapat digunakan aturan empiris untuk memperkirakan proporsi pria yang memiliki tinggi badan dalam rentang tertentu:
- Sekitar 68% pria memiliki tinggi antara 164 cm dan 176 cm (dalam satu standar deviasi dari rata-rata)
- Sekitar 95% pria memiliki tinggi antara 158 cm dan 182 cm (dalam dua standar deviasi dari rata-rata)
- Sekitar 99,7% pria memiliki tinggi antara 152 cm dan 188 cm (dalam tiga standar deviasi dari rata-rata)
FAQ (Frequently Asked Question)
Kapan menggunakan distribusi normal?
Menurut Jim Frost, distribusi normal memiliki beberapa kegunaan, misalnya untuk:
- Statistik inferensial
Ketika ukuran data cukup besar, distribusi rata-rata data cenderung mengikuti distribusi normal. Sifat ini dikenal sebagai Central Limit Theorem, yang memungkinkan peneliti untuk menggunakan distribusi normal dengan tujuan membuat inferensi atau prediksi tentang rata-rata dan varians populasi.
- Pengujian hipotesis
Jika ukuran data cukup besar dan varians populasi diketahui, seseorang dapat menggunakan distribusi normal untuk menguji hipotesis tentang rata-rata populasi.
- Analisis regresi
Ketika residual (perbedaan antara nilai prediksi dan nilai sebenarnya) dari model regresi mengikuti distribusi normal, seseorang dapat membuat kesimpulan statistik yang valid tentang prediksi model.
Mulai karirmu dalam
data-analytics
Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!