Decision Tree
Decision tree adalah algoritma berbentuk pohon yang digunakan untuk pengambilan keputusan yang berkaitan dengan masalah klasifikasi dan regresi.
product-manager
Apa itu Decision Tree?
Dirangkum dari Geeks for Geeks, decision tree adalah algoritma flowchart berbentuk struktur pohon yang digunakan untuk membantu membuat keputusan atau menyelesaikan tugas yang berkaitan dengan regresi dan klasifikasi.
Struktur decision tree dimulai dari simpul akar (root node), cabang, simpul internal (internal node/decision node), dan terakhir simpul daun (leaf node/terminal node).
Simpul akar (root node) mewakili pertanyaan atau masalah yang ingin dipecahkan. Kemudian cabang merupakan jalur keputusan, yang nantinya akan mengarah ke beberapa keputusan atau internal node.
Setiap decision tree bisa memiliki beberapa internal node sebagai alternatif jawaban atau keputusan. Internal node juga bisa memiliki cabang node lain yaitu leaf node, yang akan mewakili keputusan akhir.
Manfaat Decision Tree
Decision tree adalah algoritma supervised machine learning yang digunakan untuk mengkategorikan atau membuat prediksi dari sekumpulan pertanyaan atau tugas yang belum diselesaikan.
Decision tree dinilai sebagai salah satu algoritma yang sangat kuat karena dapat memilih atribut terbaik untuk memaksimalkan perolehan informasi untuk decision making.
Algoritma ini juga digunakan dalam random forest untuk melatih subset data pelatihan yang berbeda dan mencapai hasil yang lebih akurat.
Selain untuk memudahkan pengambilan keputusan dan memberi gambaran yang jelas mengenai alasan keputusan tersebut dibuat, decision tree juga sangat berguna untuk data mining.
Kelebihan Decision Tree
Karena strukturnya sederhana, decision tree merupakan salah satu metode tercepat untuk mengidentifikasi variabel signifikan dan hubungan antara dua variabel.
Selain itu, berikut kelebihan decision tree:
- Bersifat fleksibel karena bisa digunakan untuk tugas klasifikasi dan regresi, serta cocok untuk menangani berbagai jenis data seperti data diskrit, data kontinu, dan data kategorikal.
- Mudah dipahami, khususnya untuk orang tanpa latar belakang analitis, karena decision tree mengikuti proses yang sama seperti yang dilakukan manusia saat membuat keputusan di dunia nyata.
- Sifat hierarki decision tree mempermudah analyst melihat atribut mana yang paling penting.
- Membantu analyst memikirkan semua kemungkinan solusi untuk menyelesaikan suatu masalah.
- Decision tree hanya membutuhkan sedikit data cleaning untuk memperbaiki kesalahan atau ketidakkonsistenan dibandingkan algoritma lain.
Kekurangan Decision Tree
Kekurangan decision tree antara lain:
- Decision tree memiliki banyak lapisan sehingga terkesan kompleks dan rentan overfitting, yaitu algoritma tidak memberikan prediksi akurat untuk data pelatihan yang baru.
- Tidak didukung sepenuhnya oleh Scikit-learn, library machine learning populer berbasis Python.
- Tidak ideal untuk dataset besar karena decision tree membutuhkan waktu yang lama untuk dilatih dan lebih mahal, serta kompleksitas bisa meningkat.
Contoh Decision Tree
Tanpa disadari, decision tree sering digunakan pada kehidupan sehari-hari baik untuk pengambilan keputusan sederhana maupun kompleks.
Contoh sederhananya memutuskan tempat liburan, dengan kondisi dan kemungkinan yang digambarkan pada decision tree di bawah ini.
Decision tree juga digunakan pada berbagai sektor pekerjaan mulai dari teknologi, kesehatan, hingga keuangan. Beberapa contohnya termasuk:
- Unit gawat darurat menggunakan decision tree untuk menentukan prioritas penanganan pasien berdasarkan usia, gejala, tingkat keparahan, dan faktor terkait lainnya.
- Sistem telepon otomatis memandu pengguna ke fasilitas yang dibutuhkan. Misalnya untuk layanan A, tekan nomor 1.
- Perusahaan menggunakan decision tree untuk menentukan target anggaran iklan ke suatu produk berdasarkan data demografis yang menunjukkan kemungkinan besar produk dibeli pelanggan.
- Bank menggunakan data historis untuk memprediksi peluang nasabah akan gagal bayar.
FAQ (Frequently Asked Question)
Bagaimana cara membuat decision tree?
Dikutip dari Hubspot, ada 5 tahap sederhana untuk membuat decision tree, yaitu:
- Tentukan gagasan, masalah, atau pertanyaan yang ingin dieksplorasi. Pada contoh di atas, gagasan yang ingin dieksplorasi adalah “Rencana liburan keluarga”.
- Perluas pohon dengan menambahkan jawaban atau penyelesaian potensial. Pada contoh di atas, ada dua pilihan yang ditambahkan yaitu pantai dan villa, dengan setiap variabel memiliki kondisi atau aturan yang menyertai.
- Terus perluas cabang pohon sampai mendapatkan jawaban akhir. Lakukan cara nomor dua sampai tidak ada kemungkinan pilihan lagi.
- Pertimbangkan risiko dan kelebihan setiap variabel untuk mendapatkan hasil yang terbaik.
- Evaluasi hasil dan tentukan keputusan yang ingin diambil berdasarkan jumlah risiko yang ingin dihadapi. Pada contoh jika ingin ke villa, maka risikonya akan menghadapi macet.