Apa itu Data Modelling?
Data modelling adalah salah satu kemampuan yang diperlukan oleh data analyst untuk mengolah suatu data. Sebelum membahas tentang data modelling, ada baiknya untuk mengetahui sekilas tentang kegunaan data.
Pengambilan keputusan dan strategi bisnis yang berbasis data lebih mungkin mencapai keberhasilan. Misalnya dalam dunia digital marketing, data demografis dan riwayat pembelian user TikTok bisa dikembangkan untuk membuat strategi iklan bertarget agar menjangkau calon pembeli potensial.
Namun agar data bisa dibaca dan diolah dengan tepat, dibutuhkan standar untuk menentukan akurasi dan kemudahannya untuk diinterpretasi. Karena inilah data modelling diperlukan.
Data modelling adalah proses menyederhanakan suatu data menjadi informasi yang bisa digunakan sesuai kebutuhan bisnis. Data modelling akan mengumpulkan data tersebut dan disusun dalam diagram sederhana yang berisikan jenis data, klasifikasi, atribut, serta alur hubungan antar data.
Diagram atau blueprint yang dihasilkan disebut dengan model data atau data model. Selanjutnya model data bisa digunakan untuk membuat database sederhana maupun kompleks, merekayasa ulang suatu aplikasi yang menggunakan software usang (outdated), dan meminimalisir error.
Jadi sederhananya, data modeling adalah teknik untuk membuat suatu database dari nol.
Ada tiga jenis model data yang dihasilkan selama data modelling, yaitu:
- Model data konseptual (Conceptual data model): Model data konseptual berisi jenis data, hubungan antar data, serta aturan bisnis. Tujuan utama dari model data ini adalah untuk mengatur, mendefinisikan aturan, dan memahami konsep bisnis.
- Model data logis (Logical data model): Model data logis berisi struktur data dan detailnya seperti atribut, tipe data, dan hubungan setiap data. Biasanya, model data logis digunakan untuk proyek tertentu karena tujuannya adalah untuk mengembangkan peta teknis aturan dan struktur data.
- Model data fisik (Physical data model): Model data fisik berfungsi sebagai skema penyimpanan dan pengelolaan data pada sistem manajemen database (Database Management System/DBMS) dan aplikasi. Model data ini ditampilkan sebagai tabel, kolom, indeks, dan elemen DBMS lainnya.
Manfaat Data Modelling
Data modelling sangat penting karena dapat menghasilkan model data yang lebih sederhana dan efisien untuk pengambilan keputusan di berbagai departemen berbeda. Berikut beberapa manfaat data modelling:
- Mempermudah dan mempercepat proses desain database karena definisi hubungan data jelas
- Mengurangi error pada saat pengembangan software dan database
- Meningkatkan kinerja database dan aplikasi perangkat lunak
- Memudahkan pemetaan data di seluruh lingkungan perusahaan
- Meningkatkan komunikasi antara software developer dengan tim non-teknis seperti marketing dan business analyst.
- Dokumentasi sumber data lebih baik dan berkualitas
- Cakupan penggunaan data lebih jelas sehingga memudahkan untuk membuat keputusan dan strategi
Jenis-jenis Data Modelling
Dirangkum dari TechTarget dan IBM, berikut ini jenis-jenis data modelling:
#1 Hierarchical data modeling
Hierarchical data modeling menggambarkan hubungan antar data dalam format pohon hierarki. Seperti hierarki keluarga, orang tua digambarkan seperti akar dan cabang digambarkan sebagai anak dan cucu.
Pada jenis ini, satu data bertindak sebagai akar dan memetakan hubungan ke banyak data lainnya.
Hierarchical data modeling pertama kali digunakan dalam sistem manajemen informasi IBM (IMS) pada tahun 1966 yang kemudian populer.
Seiring berkembangnya model database, teknik ini jarang digunakan karena kurang efektif. Namun, saat ini masih ada yang menggunakan data modelling ini, seperti pada sistem Extensible Markup Language (XML) dan sistem informasi geografis (GIS).
#2 Network data modeling
Network data modelling hampir mirip dengan hierarchical data modeling. Bedanya, pemodelan data ini memungkinkan data yang bertindak sebagai ‘anak’ memiliki dua data ‘orang tua’.
Jenis data modelling ini memperlihatkan hubungan antar data yang lebih jelas dibandingkan hierarchical data modeling.
Pemodelan data jaringan pertama kali digunakan oleh The Conference on Data Systems Languages (CODASYL) pada tahun 1969. Karena itu, network data modeling juga dikenal dengan model CODASYL.
#3 Relational data modeling
Relational data modeling dibuat lebih fleksibel dibandingkan pemodelan hierarki dan jaringan. Pemodelan data relasional memetakan hubungan data dengan cara mengelompokkan data dalam tabel yang terdiri atas baris dan kolom.
Pemodelan data ini menggunakan bahasa query (permintaan) terstruktur (SQL) untuk manajemen data sehingga lebih mudah digunakan. Karena itulah relational data modelling populer hingga saat ini.
#4 Entity-relationship data modeling
Entity-relationship (ER) data modeling menggunakan diagram untuk menggambarkan hubungan antar entitas yang tersimpan dalam database.
Entitas dalam basis data bisa berupa benda, unit, atau objek lain yang mewakili sebuah data. Setiap entitas memiliki atribut atau karakteristik yang berbeda.
Misalnya, database karyawan divisi marketing pada perusahaan ‘A’. Karyawan disebut dengan entitas, dan informasi seperti nama, usia, dan tahun bekerja disebut atribut.
Entity-relationship data modeling adalah salah satu teknik penyimpanan data yang efektif karena mudah untuk dilakukan pengambilan dan pembaruan data.
#5 Dimensional data modeling
Dimensional data modeling dirancang tak hanya sebagai penyimpanan yang efisien, tapi juga mempermudah user mengakses data dengan lebih cepat. Karena itu pemodelan ini umum digunakan pada pusat penyimpanan data (data warehouse) dan data mart (bagian dari data warehouse yang menyimpan informasi yang lebih khusus).
Model data dimensi terdiri dari tabel fakta dan tabel dimensi yang mencantumkan atribut entitas dalam tabel fakta.
Misalnya, tabel fakta merinci pembelian produk ‘A’ oleh pelanggan, sedangkan tabel dimensi berisi data tentang produk ‘A’ dan informasi pembeli.
Ada beberapa jenis dimensional data modeling, dua yang paling terkenal adalah:
- Skema bintang: Data disusun menjadi fakta (item terukur) dan dimensi (atribut). Skema ini memiliki pola yang menghubungkan tabel fakta sebagai pusat yang memiliki cabang ke berbagai tabel dimensi, hubungannya menyerupai bentuk bintang.
- Skema kepingan salju: Mirip dengan skema bintang, tapi skema ini memiliki beberapa tingkat tabel dimensi sehingga polanya lebih kompleks.
#6 Object-oriented data modeling
Object-oriented data modeling mirip dengan cara entity-relationship data modeling yang merepresentasikan data, atribut, dan hubungan data. Bedanya, jenis pemodelan ini menggabungkan data dan hubungannya dalam satu struktur yang disebut objek.
Objek berbeda yang memiliki kesamaan atribut dan perilaku kemudian dikelompokkan sebagai kelas. Setiap kelas mewarisi atribut dan perilaku dari kumpulan objek di dalamnya.
Contoh Penerapan Data Modelling
Untuk mengetahui lebih jelas contoh penerapan data modelling, simak contoh berikut ini.
Perusahaan ‘X’ merupakan sebuah perusahaan retail yang menjual kebutuhan rumah tangga. Perusahaan retail biasanya menggunakan data warehouse untuk melacak pengiriman barang, jumlah penjualan, perilaku konsumen, dan lain-lain.
Untuk mengetahui total penjualan seluruh barang, perusahaan ‘X’ membutuhkan informasi sebagai berikut:
- Produk apa yang terjual
- Berapa total penjualan produk
- Siapa yang membeli produk
- Lokasi pembeli
Karena membutuhkan banyak informasi, perusahaan ‘X’ menggunakan dimensional data modelling sehingga tampilannya lebih sederhana dan mudah diakses.
Dengan dimensional data modelling, Informasi tersebut disimpan ke dalam 4 tabel dimensional yang berbeda. Setiap tabel berisi hierarki informasi yang lebih detail. Misalnya, total penjualan produk berisi data penjualan per hari, lalu dikumpulkan menjadi per minggu hingga setahun.
Selanjutnya untuk mengetahui lokasi pembeli, data yang dikumpulkan berupa kota/kabupaten, provinsi, dan negara. Lalu untuk informasi barang berisi hierarki kategori produk, sub-kategori, nama produk, dan deskripsi fitur produk.
Dengan dimensional data modelling, pebisnis bisa mengetahui informasi mengenai penjualan suatu produk dalam rentang waktu tertentu sekaligus informasi pembeli.
FAQ (Frequently Asked Question)
Apa saja langkah-langkah pemodelan data?
Ada enam tahapan dalam data modelling, yaitu:
- Mengidentifikasi entitas dari setiap data yang terkumpul
- Mengidentifikasi properti unik atau karakteristik setiap entitas
- Membuat draft hubungan antara entitas untuk memahami korelasi di antaranya
- Mengidentifikasi atribut data dan memetakannya dalam entitas untuk mengetahui bagaimana data tersebut akan digunakan
Finalisasi model data dan validasi keakuratannya. Pemodelan data perlu di-update setiap kali kebutuhan bisnis berubah.