Analisis Multivariat
Analisis multivariat merupakan metode menganalisis hubungan antara lebih dari dua variabel dalam kelompok data yang diuji.
data-analytics
Apa itu Analisis Multivariat?
Analisis multivariat merupakan salah satu metode dalam statistika yang penghitungannya perlu alat pengolahan data seperti SPSS dan SAS. Bagi data analyst dan data scientist, analisis multivariat termasuk metode yang umum digunakan.
Analisis multivariat adalah teknik mengumpulkan beberapa kelompok data dan menganalisis hubungan antara lebih dari dua variabel yang terkait dengan data tersebut.
Analisis multivariat digunakan ketika berhadapan dengan data yang memiliki setidaknya tiga variabel yang berbeda. Bisa meliputi 2 variabel independen dan 1 variabel dependen, atau sebaliknya.
Variabel dependen biasa disebut dengan variabel Y, variabel yang dipengaruhi, variabel respons, atau variabel terikat.
Sedangkan variabel independen disebut juga dengan variabel X, variabel bebas, variabel prediktor, atau variabel yang memengaruhi.
Meskipun termasuk dalam penghitungan statistika, analisis multivariat digunakan dalam berbagai bidang di antaranya linguistik, natural sciences, layanan asuransi dan finansial, dan humanities.
Misalnya untuk memprediksi cuaca, analis tidak bisa hanya bergantung pada musim.
Menurut BMKG, musim penghujan biasanya berlangsung pada bulan Oktober hingga Maret. Sedangkan musim kemarau terjadi pada bulan April hingga September.
Namun bukan berarti setiap hari akan turun hujan selama musim penghujan.
Ada hari-hari di mana cuaca tampak terik menyengat. Begitu juga dengan musim kemarau, ada hari di mana akan turun hujan.
Karena itu dilakukan analisis multivariat. Hasilnya diketahui bahwa hujan bisa dipengaruhi oleh faktor lain seperti kelembaban udara, polusi, dan arah angin.
Tujuan Melakukan Analisis Multivariat
Tujuan dilakukannya analisis multivariat adalah untuk mengetahui faktor apa yang memengaruhi sehingga menghasilkan suatu kondisi.
Selain itu, analisis multivariat juga bertujuan untuk:
- Dalam dunia digital marketing, analisis multivariat dapat mengetahui hubungan dan interaksi beberapa elemen dalam halaman web, dan meningkatkan kegunaan situs secara sistematis untuk menambah tingkat konversi pengunjung website menjadi customer.
- Bagi software engineer, analisis multivariat bisa digunakan sebagai metode pengujian software yang efektif dengan mempertimbangkan faktor-faktor yang memengaruhi hasil dari software development.
- Membantu perusahaan mengenali target pelanggan baru dan mengidentifikasi tren pasar selama waktu tertentu.
- Membantu perusahaan memperkirakan peluang bisnis, risiko, dan permintaan produk di masa mendatang.
- Membantu perusahaan menetapkan strategi investasi, keputusan bisnis, dan menetapkan ekspektasi.
Macam-macam Analisis Multivariat
Ada berbagai jenis analisis multivariat yang secara garis besar dibagi menjadi dua kelompok utama, yaitu metode dependence dan interdependence.
#1 Metode dependence
Metode dependence digunakan ketika ada satu atau lebih variabel bergantung (dependent) dengan variabel lain. Teknik ini melihat hubungan sebab-akibat yang dihasilkan dari variabel tersebut.
Contohnya seperti memprediksi cuaca yang telah disebutkan sebelumnya, di mana “hujan” sebagai variabel dependen dan “kelembaban udara”, “polusi”, dan “arah angin” merupakan variabel independen.
Metode dependence termasuk di antaranya:
- Multiple Regression Analysis
Analisis regresi berganda digunakan ketika ada satu variabel dependen (Y) dan dua atau lebih variabel independen (X).
Dalam metode ini, variabel independen ditandai dengan nomor. Misalnya, x1, x2, x3, dst.
- Linear Probability Model
Linear probability model (LPM) merupakan metode regresi linear yang outcome atau hasilnya berupa bilangan biner (0 atau 1), dan satu atau lebih variabel independen digunakan untuk memprediksi hasilnya.
- Multivariate Analysis of Variance and Covariance
Multivariate Analysis of Variance (MANOVA) adalah perluasan dari teknik Analysis of Variance (ANOVA).
Teknik ini mengukur efek dari dua atau lebih variabel independen terhadap dua atau lebih variabel dependen.
Sederhananya, data yang memiliki dua variabel X dan dua variabel Y dihitung dengan teknik ini.
#2 Metode interdependence
Teknik interdependence adalah jenis hubungan yang variabelnya tidak bisa diklasifikasikan sebagai dependen atau independen.
Teknik ini bukan untuk mencari hubungan sebab-akibat, tapi untuk mendeskripsikan struktur dan pola data.
Berikut ini dua metode interdependence yang umum digunakan:
- Factor Analysis
Analisis faktor adalah teknik mengurangi variabel yang akan diuji jika dalam kelompok data ada terlalu banyak variabel.
Tujuannya untuk melihat pola data lebih mudah. Jika ada terlalu banyak variabel, sulit untuk melihat pola data dan kemungkinan error tinggi.
Untuk mereduksi data, analisis faktor akan mendeteksi pasangan variabel dengan korelasi tinggi, lalu menggabungkannya menjadi satu variabel.
- Cluster Analysis
Cluster analysis adalah teknik mengelompokkan item yang sama menjadi satu kelompok.
Untuk melakukan teknik ini, pertama-tama bagi data menjadi kelompok kecil dengan kemiripan yang sama, kemudian labeli sesuai dengan karakteristik kelompok tersebut.
Contoh Analisis Multivariat
Rizki bekerja di bidang pemasaran, dan ingin melihat pola konsumen terhadap brand perusahaannya menggunakan teknik analisis faktor.
Dikatakan, kumpulan data tersebut berisikan variabel seperti pendapatan, tingkat pendidikan, pekerjaan, persentase konsumen melakukan pembelian produk tertentu, persentase konsumen merekomendasikan produk ke teman.
Dengan analisis faktor, Rizki bisa mengelompokkan beberapa variabel yang berkaitan erat.
Misalnya, variabel pendapatan, tingkat pendidikan, dan pekerjaan memiliki korelasi yang tinggi. Maka ketiganya dikelompokkan menjadi satu variabel yang disebut “status sosial ekonomi”.
Selanjutnya, persentase konsumen melakukan pembelian produk tertentu dan persentase konsumen merekomendasikan produk disederhanakan menjadi satu variabel “kepuasan pelanggan”.
FAQ (Frequently Asked Question)
Kapan analisis multivariat digunakan?
Analisis multivariat digunakan ketika berhadapan dengan data yang memiliki setidaknya tiga variabel dalam kelompok data, baik itu variabel independen (X) maupun variabel dependen (Y).
Setelah dibedakan jumlah variabel dan tujuannya, analis akan melakukan teknik yang sesuai.