Apa Saja Metode Data Mining?

Ada beberapa metode atau fungsi data mining yang bisa digunakan untuk menemukan, menggali dan menambang pengetahuan. Ada 5 fungsi utama dalam data mining, antara lain:

  1. Estimasi: untuk menerka sebuah nilai yang belum diketahui, misal menerka penghasilan seseorang ketika informasi mengenai orang tersebut diketahui. Metode yang digunakan antara lain Point Estimation dan Confidence Interval Estimations, Simple Linear Regression dan Correlation, dan Multiple Regression.
  2. Prediksi: untuk memperkirakan nilai masa mendatang, missal memprediksi stok barang satu tahun ke depan. Fungsi ini mencakup metode Neural Network, Decision Tree, dan kNearest Neighbor.
  3. Klasifikasi: merupakan proses penemuan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Metode yang digunakan antara lain Neural Network, Decision Tree, k-Nearest Neighbor, dan Naive Bayes.
  4. Klastering: pengelompokan mengidentifikasi data yang memiliki karakteristik tertentu. Metode dalam fungsi ini diantaranya Hierarchical Clustering, metode K-Means, dan Self Organizing Map (SOM)
  5. Asosiasi: dinamakan juga analisis keranjang pasar dimana fungsi ini mengidentifikasi item-item produk yang kemungkinan dibeli konsumen bersamaan dengan produk lain. Metode atau algoritma dalam fungsi ini adalah Apriori, Generalized Sequential Pattern (GSP), FP-Growth dan GRI algorithm 

Sedangkan metode pembelajaran dapa data mining dibagi menjadi 3, yaitu:

      1. Supervised Learning:
        • Pembelajaran dengan guru, data set memiliki target/label/class
        • Sebagian besar algoritma data mining (estimation, prediction/forecasting, classification) adalah supervised learning
        • Algoritma melakukan proses belajar berdasarkan nilai dari variabel target yang terasosiasi dengan nilai dari variable prediktor
      2. Semi Supervised Learning:
        • Semi-supervised learning adalah metode data mining yang menggunakan data dengan label dan tidak berlabel sekaligus dalam proses pembelajarannya
        • Data yang memiliki kelas digunakan untuk membentuk model (pengetahuan), data tanpa label digunakan untuk membuat batasan antara kelas
      3. Unsupervised Learning:
        • Algoritma data mining mencari pola dari semua variable (atribut)
        • Variable (atribut) yang menjadi target/label/class tidak ditentukan (tidak ada)
        • Algoritma clustering adalah algoritma unsupervised learning

 

Leave a Reply

Your email address will not be published. Required fields are marked *