Minggu, 26 Agustus 2012

Perbandingan Classifier OneR, Naive Bayes dan Decission Tree (1)

Diggingggg
Data  Mining  berbicara  mengenai  penjelasan  hal  yang  sudah  terjadi  di  kejadian  lalu  dan mencoba  memprediksi  hal  tersebut  di  masa  depan  dengan  cara  melakukan  analisis  data.  Data mining  adalah  gabungan  dari  berbagai  disiplin  dari  mulai  statistika,  kecerdasan  buatan  sampai kepada  teknologi  database. 

Nilai  dari  aplikasi  data  mining  sangat  berharga.  Perusahaan  /  bisnis yang menyimpan data-data dalam jumlah  yang besar dapat dianalisa menggunakan data mining ini  untuk  mengekstraksi  dan  menghasilkan  pengetahuan  yang  sangat  berharga  dari  data-data
tersebut. 

Dengan  pengetahuan  yang  dihasilkan,  memungkinkan  bagi  perusahaan/bisnis  untuk mendapatkan customer yang lebih  atau penjualan yang meningkat


Area data mining


Posisi dari classifier dalam data mining

Seperti terlihat pada gambar di atas bahwa untuk dapat melakukan prediksi kejadian di masa  depan maka data mining akan membuat  sebuah model. Outcame dari model ini jika terkategori maka  disebut  sebagai  classification.  Jika  outcomenya  adalah  berupa  numeric  maka  disebut regression. Model yang membagi hasil observasi menjadi beberapa cluster yang sejenis disebut sebagai clustering. Association rules seperti namanya akan mencari hal yang paling terkait. 


Contoh model

One-R Classifier

Adalah  singkatan  dari  One  Rule.  Algoritmanya  akan  membangkitkan  sebuah  rule  untuk setiap atribut kemudia memilih rule dengan error paling kecil dan digunakan sebagai One Rule nya.  Untuk  membuat  rule  setiap  atribut  (predictor)  yang  ada  maka  perlu  membuat  table kemunculan  (frequency  table)  untuk  setiap  atribut  dengan  targetnya.  Contoh  bagaimana algoritma OneR ini bekerja dapat dilihat pada kasus di bawah ini.

Contoh Target dan Predictor

Hasil Tabel Frekuensinya :


Dengan  melihat  table  frekuensi  di  atas  maka  didapatkan  bahwa  error  terkecil  ada  pada
predictor/atribut Outlook, sehingga Outlook yang akan dijadikan sebagai One Rule nya yaitu :



Rule ini dapat digunakan untuk memprediksi kejadian Play yang akan datang. Selama mengikuti
rule ini maka OneR akan memprediksi bahwa akan bermain golf.





Tidak ada komentar:

Posting Komentar