Senin, 06 September 2021

KONSEP DATA MINING

 

LATAR BELAKANG 

  • Banyak data yang telah direkam dan disimpan
  • Transaksi penjualan di Supermarket 
    • Transaksi perbankan dan Kartu Kredit
    • Log kunjungan WEB
    • Akuisisi data dalam penelitian (sosial, kesehatan,…) 
  • Sistem Komputer semakin cepat dan ekonomis (Moore’s Law)
  • Kebutuhan berkompetisi dengan strategi yang tepat semakin meningkat 

TRANSFORMASI DIGITAL DATA MINING


LEDAKAN PERTUMBUHAN DATA


MENGAPA HARUS DATA MINING?

  • Data yang sangat besar terkadang memiliki informasi yang tersembunyi
  • Kemampuan manusia terbatas untuk mengamati kumpulan data tersebut dalama proses analisis 







DEFINISI DATA MINING


PENGERTIAN YANG SALAH


ILMU DATA MINING

  • Gabungan dari beberapa bidang ilmu dalam Memantik dan Ilmu Komputer
  • Diperlukan karena: 
    • Data yang sangat besat
    • Dimensi data yang besar
    • Data Heterogen














ARSITEKTUR DATA MINING


ARSITEKTUR DATA MINING

  • Knowledge Base
    • Domain Knowledge yang digunakan untuk memberi petunjuk pencarian atau mengevaluasi hasil pola
  • Data Mining Engine
    • Terdiri dari sekumpulan model fungsional seperti characterization, association, classification, cluster analysis, evaluation and deviation analysis
  • Pattern Evaluation Module
    • Komponen yang berinteraksi dengan modul data mining untuk pencarian pola
  • GUI (Graphical User Interface)
    • modul yang mempermudah user berinteraksi dengan sistem data mining

TUGAS DATA MINING


METODE DALAM DATA MINING



PREDICTIVE - CLASSIFICATION

  • Menemukan fungsi atau model yang membedakan kelas data
  • Fungsi atau model tsb dapat berbentuk aturan if-else, descision tree, formula matematika, atau neural network
  • Tujuannya untuk memperkirakan kelas dari suatu objek yang labelnya tidak diketahui
  • Algoritma : Decision Tree (C4.5), Artificial Neural Network, Naïve Bayes, Genetic Algorithm, Fuzzy, Case-Based Reasoning, k-Nearest Neighbor
  • Supervised Method

PREDICTIVE - CLASSIFICATION


CONTOH  

  • Pemakaian Kartu Kredit secara Ilegal
  • Tujuan : 
    • Mendeteksi adanya penggunaan Kartu Kredit secara Ilegal
  • Pendekatan:
    • Mencari data transaksi sebelumnya (Lokasi & waktu transaksi, jenis barang yg dibeli, nilai transaksi)
    • Labeli data-data tersebut dengan Label Curang atau Aman
    • DM mencari model klasifikasi Curang & Aman berdasarkan atribut transaksi
    • Menerapkan model tersebut jika ada transaksi baru untuk mempercepat/tepat tindakan preventif

CONTOH LAIN

  • Deteksi SPAM  
    • tindakan preventif untuk mendeteksi email yang tidak diharapkan 
  • Direct Marketing 
    • Mencari pengelompokan profil pelanggan agar target market sesuai dengan produk yang akan dipasarkan 
  • Sky Survey Cataloging 
    • Mengelompokan benda langit hasil pemotretan teleskop kedalam class nya

METODE POHON KEPUTUSAN















PREDICTIVE – TIME SERIES ANALYSIS

  • Time series data : sekuens data yang nilainya berubah setiap interval waktu tertentu.
  • Time series data dapat dipresentasikan dalam bentuk grafik atau kurva yang menunjukkan fungsi sebuah variabel data terhadap satuan waktu. 
  • Metode : Neural Network (model Backpropagation, multi layer perceptron)
  • Aplikasi : memprediksikan indeks harga saham 

CONTOH : PREDIKSI DALAM PASAR SAHAM

garis yang tegas adalah time-series data sebenarnya dari nilai saham Microsoft, dan garis putus-putus adalah time series model yang memprediksi nilai saham berdasarkan nilai saham pada masa lalu


PREDICTIVE - REGRESSION

  • Regression vs Classification : 
    • Regression diterapkan untuk mengklasifikasikan target data numerik
    • Classification untuk mengklasifikasikan target data kategorial
  • Aplikasi : prediksi nilai penjualan yang akan datang berdasarkan trend data penjualan tahun sebelumnya. 
  • Algoritma : Support Vector Machine (SVM), Generalized Linear Model (GLM) 

DESCRIPTIVE - CLUSTERING 

  • Mengidentifikasi kelompok alami dari data berdasarkan kemiripan atribut : seringkali disebut juga Segmentation
  • Unsupervised Method : tidak satupun atribut yang digunakan untuk memandu proses pembelajaran (tidak ada label)
  • Algoritma : k-Means, k-Medoid, Fuzzy C-Means, Subtractive, Mountain, Hierarki

CONTOH : DATA PELANGGAN

  • Terdiri dari dua atribut, yaitu Age (Umur) dan Income (Pendapatan).
  • Algoritma Clustering mengelompokkan kelompok data kedalam tiga segment berdasarkan kedua atribut ini.
    • Cluster 1 : populasi berusia muda dengan pendapatan rendah 
    • Cluster 2 : populasi berusia menengah dengan pendapatan yang lebih tinggi
    • Cluster 3 : populasi berusia tua dengan pendapatan yang relatif rendah. 

SEGMENTASI PASAR

  • Tujuan: mencari gugus segmentasi pasar berdasarkan data transaksi untuk keperluan marketing 
  • Pendekatan: 
    • mempersiapkan data transaksi beserta atribut data pelanggan berdasarkan geografi dan data pribadi lainnya 
    • mencari gugus pelanggan yang mirip berdasarkan atribut atribut tersebut 
    • melakukan observasi perilaku pasar berdasarkan gugus-gugus pelanggan yang ditemukan 
  • Hasil : Strategi marketing yang tepat sasaran

DESCRIPTIVE – ASSOCIATION RULE

  • Disebut juga Market Basket Analysis.
  • Menganalisa tabel transaksi penjualan dan mengidentifikasi produk-produk yang seringkali dibeli bersamaan oleh customer 
    • Untuk mengidentifikasi kelompok kesamaan dari produk dan kebiasaan apa yang terjadi guna kepentingan cross-selling
    • Untuk mencari produk apa yang biasanya terjual bersamaan
    • Untuk mencari tahu apa aturan yang menyebabkan kesamaan tersebut

CONTOH
















  • Ketika orang membeli susu, dia biasanya membeli keju 
  • Ketika orang membeli pepsi atau coke, biasanya dia membeli juice 

CONTOH LAIN


MARKETING & SALES PROMOTION

  • Contoh pola yang ditemukan
    • {Susu Kental Manis,…} —> {Kwaci}
  • Kwaci sebagai konsekuen: bagaimana caranya menaikan penjualan kwaci
  • Susu Ketal Manis sebagai anteseden: jika tidak lagi menjual susu kental manis, memprediksi produk lain yang ikut jatuh penjualannya
  • Dua duanya: membuat paket promo Susu Kental Manis, Kwaci, dll…

DESCRIPTIVE – SEQUENCE ANALYSIS

  • Digunakan untuk mencari pola pada serangkaian kejadian yang disebut dengan Sequence.
  • Contoh rangkaian klik pada sebuah website berisi rentetan URL. 
  • Implementasi : memodelkan pembelian oleh pelanggan sebagai sebuah sequence (rangkaian) data : 
    • Pertama-tama seorang pelanggan membeli komputer 
    • kemudian membeli speaker 
    • dan akhirnya membeli sebuah webcam.

CONTOH : RANGKAIAN KLIK PADA SEBUAH WEBSITE BERITA














  • Setiap node adalah sebuah kategori URL. 
  • Garis melambangkan transisi antar kategori URL tersebut. 
  • Setiap transisi dikelompokan dengan sebuah bobot yang menggambarkan kemungkinan transisi antara satu URL dan URL yang lain


Tidak ada komentar:

Posting Komentar

Apa itu BIOS ? Berikut Pengertian dan Fungsinya

  Pengertian BIOS Apa itu Bios? Berikut Pengertian dan Fungsinya. BIOS (  Basic Input Output System )  adalah sebuah sistem dasar pada sebua...