Pengertian
Serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data. informasi yang dihasilkan diperoleh dengan cara mengektraksi dan mengenali pola yang penting atau menarik dari data yang terdapat dalam basis data.
Latar belakang
Kehadiran data mining dilatar belakangi oleh berlimpah data (overload data) yang dialami berbagai perusahaan. berlimpahnya data ini merupakan akumulasi dari data transaksi yang terekam bertahun-tahun.
Manfaat
Pemanfaatan data mining dapat digunakan dalam menangani meledaknya volume data. Bagaimana menyimpannya, mengekstraknya serta memanfaatkannya.
Juga digunakan untuk menangani persoalan menumpuknya data/informasi dan bagaimana menggudangkannya tanpa kehilangan informasi yang penting (warehousing).
Data mining dapat digunakan untuk mengcapture, menganalisis serta menyimpan data bersifat real time dan sangat besar. Misalnya: remote sensor yang diletakkan pada sudut satelit, simulasi saintifik yang membangkitkan data dalam ukuran terrabytes.
Merupakan salah satu metode alternatif yang dapat digunakan untuk mengolah data mentah, ketika metode konvensional tidak fisibel untuk dilakukan karena besarnya volume data yang diolah.
Data Warehouse
Suatu koleksi data yang digunakan untuk menunjang pengambilan keputusan manajemen, yang berorientasi objek (topik), terpadu, time variant, dan tidak mudah berubah.
Suatu database penunjang keputusan yang dikelola secara terpisah dari database operasional perusahaan.
Model data multidimensi adalah himpunan pengukuran numerik yang tergantung pada himpunan dimensi. Misalnya: melihat sales, dimensinya adalah produk, lokasi, waktu.
Relasi utama yang berhubungan dengan dimensi adalah fact table.
View digunakan secara luas dalam aplikasi decision support. kelompok analisis yang berbeda dalam suatu organinsasi biasanya berhubungan dengan aspek bisnis yang berbeda, dan akan memudahkan untuk mendefinisikan view yang memberikan tiap grup detail
OLTP (OnLine Transaktion Proccesing)
=> Object: customer
=> Data Content: detail
=> DB design: ER + App
=> View: current, local
=> Access: update
OLAP (OnLine Analytical Proccessing)
=> Market
=> History, terapung
=> Start + subject
=> Evaluasi, Integrasi
=> hanya bisa dibaca
Algoritma data mining
1. Classifikasi: data yang sudah ada dikelaskan
2. Classtering: pengelompokan data (tidak ditentukan kelas)
3. Assosiation Rules: pengelompokan data (prediksi)
4. Regresion: prediksi dari variabel yang naik
5. Sequential pattern: prediksi tren, pola yang berurutan
6. Devisiation detection: diluar kebiasaan
Serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data. informasi yang dihasilkan diperoleh dengan cara mengektraksi dan mengenali pola yang penting atau menarik dari data yang terdapat dalam basis data.
Latar belakang
Kehadiran data mining dilatar belakangi oleh berlimpah data (overload data) yang dialami berbagai perusahaan. berlimpahnya data ini merupakan akumulasi dari data transaksi yang terekam bertahun-tahun.
Manfaat
Pemanfaatan data mining dapat digunakan dalam menangani meledaknya volume data. Bagaimana menyimpannya, mengekstraknya serta memanfaatkannya.
Juga digunakan untuk menangani persoalan menumpuknya data/informasi dan bagaimana menggudangkannya tanpa kehilangan informasi yang penting (warehousing).
Data mining dapat digunakan untuk mengcapture, menganalisis serta menyimpan data bersifat real time dan sangat besar. Misalnya: remote sensor yang diletakkan pada sudut satelit, simulasi saintifik yang membangkitkan data dalam ukuran terrabytes.
Merupakan salah satu metode alternatif yang dapat digunakan untuk mengolah data mentah, ketika metode konvensional tidak fisibel untuk dilakukan karena besarnya volume data yang diolah.
Data Warehouse
Suatu koleksi data yang digunakan untuk menunjang pengambilan keputusan manajemen, yang berorientasi objek (topik), terpadu, time variant, dan tidak mudah berubah.
Suatu database penunjang keputusan yang dikelola secara terpisah dari database operasional perusahaan.
Model data multidimensi adalah himpunan pengukuran numerik yang tergantung pada himpunan dimensi. Misalnya: melihat sales, dimensinya adalah produk, lokasi, waktu.
Relasi utama yang berhubungan dengan dimensi adalah fact table.
View digunakan secara luas dalam aplikasi decision support. kelompok analisis yang berbeda dalam suatu organinsasi biasanya berhubungan dengan aspek bisnis yang berbeda, dan akan memudahkan untuk mendefinisikan view yang memberikan tiap grup detail
OLTP (OnLine Transaktion Proccesing)
=> Object: customer
=> Data Content: detail
=> DB design: ER + App
=> View: current, local
=> Access: update
OLAP (OnLine Analytical Proccessing)
=> Market
=> History, terapung
=> Start + subject
=> Evaluasi, Integrasi
=> hanya bisa dibaca
Algoritma data mining
1. Classifikasi: data yang sudah ada dikelaskan
2. Classtering: pengelompokan data (tidak ditentukan kelas)
3. Assosiation Rules: pengelompokan data (prediksi)
4. Regresion: prediksi dari variabel yang naik
5. Sequential pattern: prediksi tren, pola yang berurutan
6. Devisiation detection: diluar kebiasaan
Komentar