Apa itu Uji Kolmogorov Smirnov?
Uji Kolmogorov Smirnov adalah salah satu rumus yang paling sering digunakan dalam bidang data science. Meski terdengar rumit, namun uji Kolmogorov Smirnov tidak sesulit kedengarannya.
Uji Kolmogorov Smirnov atau sering disingkat sebagai KS test adalah tes non-parametrik untuk melihat perbedaan distribusi pada dua sampel yang berbeda.
Uji Kolmogorov-Smirnov terbagi menjadi dua jenis, yaitu one-sample test dan two-sample test.
Uji Kolmogorov-Smirnov satu sampel (one-sample) merupakan goodness-of-fit test, karena fokusnya adalah melihat kesesuaian distribusi antara dua sampel tersebut. Biasanya, sampel yang dibandingkan adalah sampel distribusi yang diamati dengan sampel distribusi teoritis atau distribusi baku.
Sedangkan uji Kolmogorov-Smirnov dua sampel (two-sample) menilai apakah dua sampel independen yang diamati diambil dari populasi yang sama atau identik.
Meskipun uji Kolmogorov Smirnov sering digunakan untuk melihat apakah data terdistribusi normal, tes ini bersifat non-parametrik.
Tes nonparametrik adalah pengujian bisa dilakukan tanpa bergantung pada asumsi tertentu yang menyertai kelompok data yang diamati.
Artinya, uji Kolmogorv-Smirnov berarti bisa digunakan pada semua jenis distribusi data, seperti distribusi normal dan binomial, kecuali distribusi diskrit.
Uji Kolmogorov Smirnov biasanya dilakukan menggunakan software khusus penghitungan statistika seperti SPSS.
Kapan Uji Normalitas Kolmogorov Smirnov Digunakan?
Uji Kolmogorov Smirnov merupakan salah satu tes yang paling fleksibel, sehingga umum digunakan untuk melihat perbedaan distribusi dua kelompok.
Berikut waktu yang tepat menggunakan uji Kolmogorov Smirnov:
- Jika ada dua sampel distribusi data yang ingin dibandingkan, yaitu sampel yang diamati dengan sampel distribusi baku
- Untuk mengevaluasi sekumpulan pola data sesuai dengan pola data yang dihipotesiskan serta mengetahui jenis distribusinya, misalnya distribusi normal atau binomial
- Tidak ada asumsi bentuk atau parameter distribusi yang menyertai sampel
- Jika hasil pengujian parametrik seperti t test kurang meyakinkan
Berikut kapan sebaiknya uji Kolmogorov Smirnov tidak digunakan:
- Jika sampel data yang ingin dibandingkan lebih dari dua
- Jika distribusi merupakan data diskrit
- Jika sampel data yang diamati berasal dari sampel distribusi baku
Contoh Penggunaan Uji Kolmogorov Smirnov
Sebuah penelitian dilakukan untuk mengetahui berapa banyak orang yang menggunakan smartphone merek ABCD.
Smartphone itu bisa saja merupakan milik pribadi, yang berarti penggunanya hanya satu orang. Namun smartphone juga bisa digunakan oleh beberapa orang secara bergantian karena merupakan inventaris kantor.
Untuk mengidentifikasi apakah smarphone tersebut digunakan oleh satu orang atau secara bersama-sama, maka dilakukan uji Kolmogorov Smirnov.
Hipotesis yang diajukan adalah smartphone yang digunakan oleh satu orang lebih banyak dibandingkan dengan smartphone yang digunakan secara bersama-sama.
Setelah diteliti, hasilnya sesuai dengan hipotesis tersebut yang berarti smartphone ABCD lebih banyak digunakan oleh satu pengguna.
FAQ (Frequently Asked Question)
Apakah ada uji normalitas selain Kolmogorov Smirnov?
Uji normalitas terbagi menjadi beberapa jenis, namun salah satu yang paling umum digunakan adalah uji Kolmogorov Smirnov.
Beberapa jenis uji normalitas yaitu Shapiro Wilk, Anderson Darling, skewness, kurtosis, dan box plot.
Meski ada berbagai macam uji normalitas, tapi tujuan, persyaratan, dan hipotesisnya berbeda-beda.
Misalnya, uji Kolmogorov Smirnov dan Shapiro Wilk termasuk uji non-parametrik dan goodness-of-fit yang fungsinya menentukan kedua sampel memiliki distribusi yang sama atau yang dihipotesiskan.
Keduanya juga bisa digunakan pada sampel berukuran kecil ataupun besar. Namun, tes Shapiro Wilk lebih cocok digunakan untuk penelitian dengan jumlah sampel kurang dari 50 sampel.
Sedangkan Kolmogorov Smirnov lebih cocok digunakan pada penelitian dengan jumlah sampel lebih dari 50 sampel.
Contoh lainnya adalah pengujian skewness dan kurtosis. Skewness digunakan untuk mengukur derajat kemiringan atau ketidakseimbangan distribusi data melalui grafik, apakah arah grafiknya lebih condong ke kiri atau ke kanan dibandingkan pada grafik distribusi normal.
Sedangkan kurtosis melihat seberapa banyak data berkelompok di ekor atau puncak grafik distribusi normal. Kurtosis membantu peneliti melihat sifat dari distribusi data.
Karena itu sebelum memutuskan jenis tes distribusi normal yang ingin digunakan, sebaiknya pertimbangkan jumlah sampel, kelompok sampel, tujuan, hipotesis yang diajukan, dan persyaratan lainnya.