Jumat, 30 September 2016

DATA MINING

kali ini saya mencoba membahas apa itu data mining, pengertian data mining, definisi data mining. setelah vakum untuk beberapa hari ini karena sibuk kuliah. :)
Data mining merupakan serangkaian proses untuk mengenali nilai tamah beruba informasi yang selama ini tidak diketahui secara manual dari suatu basisdata dengan melakukan penggalian pola-pola dari data dengan tujuan untuk memanipulasi data menjadi informasi yang berharga yang diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat dalam basisdata.

Data mining memiliki banyak fungsionalitas, antara lain pembuatan data analisis asosiasi antar data, klasifikasi data, prediksi, dan pengelompokan data. Setiap fungsionalitas akan menghasilkan pengetahuan atau pola yang berbeda satu sama lain. pada klasifikasi, akan dihasilkan sebuah model dapat memprediksi kelas atau kategori dari objek-objek di dalam basisdata. sebagai contoh, klasifikasi dapat digunakan oleh petugas peminjaman uang disebuah bank untuk memprediksi pemohon mana yang aman dan mana yang beresiko untuk diberikan pinjaman, oleh manajer pemasaran. pemohon mana yang aman dan mana yang beresiko untuk diberi pinjaman, oleh manajer pemasaran di sebuah toko elektronik untuk memprediksi apakah seorang pelanggan akan membeli komputer baru, atau oleh periset di bidang medis untuk memprediksi jenis pengobatan apa yang cocok diberikan kepada seorang pasien dengan penyakit tertentu. Pada kasus-kasus tersebut, model klasifikasi dibuat untuk memprediksi kelas ”aman” atau ”beresiko” untuk data permohonan pinjaman; ”beli” atau ”tidak” untuk data pemasaran; dan ”pengobatan-1”, ”pengobatan-2”, atau ”pengobatan-3” untuk data medis. Model klasifikasi dibuat dengan cara menganalisis training data (terdiri dari objek-objek yang kelasnya sudah diketahui). Model yang dihasilkan kemudian akan digunakan untuk memprediksi kelas dari unknown data (terdiri dari objek-objek yang kelasnya belum diketahui). Model klasifikasi dapat digambarkan dalam beberapa bentuk, seperti aturan klasifikasi (IF-THEN), pohon keputusan, rumus matematika, atau jaringan saraf tiruan. Pohon keputusan banyak digunakan karena mudah dipahami oleh manusia serta mampu menangani data beratribut banyak.

0 komentar:

Posting Komentar