Showing posts with label teknologi. Show all posts
Showing posts with label teknologi. Show all posts

Thursday, 13 June 2013

Metode dalam Data Mining

Artikel sebelumnya telah membahas perkenalan data warehouse. Baca di sini. Selanjutnya dalam artikel kali ini akan di bahas metode apa saja yang ada dalam data mining. Terdapat beberapa metode dalam data mining, antara lain metode untuk clustering, classification, dan association.

Clustering atau pengelompokan merupakan teknik untuk mengelompokkan data ke dalam suatu kelompok tertentu. Metode clustering dalam data mining antara lain DBScan, Simple K-mean, Hierarchical CLustering. Dua terakhir pada metode clustering dalam data mining ini juga dipelajari pada mata kuliah Statistika Multivariat Terapan. Sebagai contoh untuk clustering: Terdapat 5 negara: Indonesia, Singapura, India, Inggris, Jerman. Maka 5 negara tersebut dapat dijadikan dua klaster berdasarkan letak geografisnya: Eropa (Inggris, Jerman) dan Asia (Indonesia, Singapura, India). Namun juga dapat dijadikan dua klaster yang berbeda berdasarkan tingkat sector industri dan jasa: Negara maju (Singapura, Inggris, Jerman) dan Negara berkembang (Indonesia, India).

Classification merupakan teknik pengklasifikasian data. Bedanya data dengan clustering pada clustering variabel dependen tidak ada sedangkan pada classification diharuskan ada variabel dependen. Contohnya pembagian criteria calon debitur yakni debitur baik dan buruk. Metode classification dalam data mining banyak sekali, misalnya ID3, C4.5, K Nearest Neighbors.

Associaton merupakan teknik dalam data mining yang mempelajari hubungan data. Associatin Rule  ini biasa digunakan pada supermarket untuk menganalisis perilaku pelanggan dalam berbelanja. Sebagai contoh jika pelanggan membeli barang A, B, C maka pelanggan akan membeli barang X. Atau dalam notasi biasa ditulis: A, B, C -> X .
Biasanya dalam software data mining juga ada beberapa metode baik clustering atau klasifikasi yang berasal dari cabang soft computing, misalnya neural network. Metode yang berasal dari soft computing yang biasanya juga disinggung dalam data mining antara lain perceptron , backpropagation (multilayer perceptron), self organizing map (SOM).

Data Warehouse dan Data Mining

Apakah yang ada di benak jika kita berbicara tentang data mining? Hmm. Yang pasti kata data kita semua sudah tahu. Lalu ‘mining’, apakah tambang? Jadi data mining adalah data tentang pertambangan ataukah menambang data? Tentu saja bukan itu. Maksudnya data mining adalah suatu teknik untuk mendapatkan informasi yang diperoleh dari data. Jumlah data pada data mining bisa mencapai ribuan atau dalam ukuran memori bisa satuan GB bahkan TB. Kebayang kan gedenya kayak apa?
Data warehouse
Sebelum berbicara lebih banyak apa itu data mining alangkah baiknya jika kita mengenal lebih dahulu data warehouse atau yang lebih kita kenal sebagai gudang data. Data warehouse merupakan teknik penyimpanan data. Data warehouse berbeda dengan database walaupun begitu, keduanya memiliki hubungan yang erat. Mari kita lihat dahulu perbedaan database dengan data warehouse.
Database biasanya merupakan data harian atau rentang waktu yang lebih kecil dari itu, dan sifat datanya adalah real time. Sedangkan data warehouse merupakan gabungan data dari beberapa database, maka data yang ada pada datawarehouse merupakan data historis. Sebagai contoh. Bank X memiliki pusat di kota Y memiliki cabang di kota A, B,C masing-masing kota memiliki database. Nah di kota Y data yang ada pada database lalu dikumpulkan di kota Y. Gabungan data dari beberapa database itu kemudian dimasukkan ke dalam gudang data yang dalam istilah kerennya data warehouse. Data warehouse sifatnya bukan realtime, melainkan data historis.
Software yang bisa digunakan untuk data warehouse adalah pentaho. Kita dapat belajar pentaho secara gratis dengan memanfaatkan pentaho versi community. Nah pada data warehouse dikenal proses ETL yakni extract, transform, dan load. Setelah ketiga proses yang cukup panjang itu maka diperoleh ringkasan data. Gunanya nanti untuk melihat bentuk yang lebih sederhana dari akumulasi suatu data dalam beberapa kelompok. Misalnya dikelompokkan berdasarkan tahun, bulan, kota/lokasi, jenis transaksi, bidang.  Bentuk ini nantinya yang kita kenal dengan sebutan data multidimensional. Nah untuk analisis lebih jauh, daa multidimensional ini di filter sesuai dimensi yang diinginkan. Dimensi adalah sebutan bagi variabel dalam datawarehouse dan data mining. Misalnya dalam datawarehouse ini terdapat dimensi no proposal, kode PT, status, bidang tahun, ingin dilihat jumlah penelitian dari semua bidang pada tiap-tiap tahun maka dilakukan filter terhadap kode PT, no proposal, program, status, dan hasilnya adalah sebagai berikut:

Sunday, 28 April 2013

Membuat Personal Logo Search Engine


Penasaran dengan gambar di atas? Yup, membuat personal logo search engine bukanlah hal yang mustahil. caranya cukup mudah dan amat sangat mudah. Yakni dengan funnylogo.info. Website ini menyediakan personal logo yang dapat dibuat sesuai selera, ya seperti contoh saya diatas, dengan style Google. Anda juga bisa membuat logo dengan style yang lainnya misalnya dengan font Yahoo!, Lord Of The Ring, Harry Potter, Star Wars.

caranya mudah, masuk ke http://funnylogo.info/, lalu masukkan nama atau kata yang nanti dijadikan logo. Lalu pilih style logo kemudian klik Create My Search Engine. Personal search engine selesai dibuat, jadikan personal search engine tersebut sebagai homepage.

Friday, 26 April 2013

Kecerdasan Buatan

Sebelum kita membahas lebih lanjut apa itu kecerdasan buatan, mari kita lihat beberapa teknologi yang ada di sekitar kita.
  • Pernahkan kita melihat di televisi dalam suatu film terdapat wajah seseorang yang dapat diidentifikasi oleh komputer?
  • Dalam dunia game, tidak heran jika komputer pun bisa terlihat lebih cerdas daripada manusia.
  • Sebuah komputer dapat mengidentifikasi kelayakan calon debitur hanya dengan beberapa karakteristik.
Itulah yang akan kita bahas nanti. 

Definisi Kecerdasan Buatan (Artificial Intelligence/AI):
Merupakan bidang ilmu komputer yang berusaha membuat mesin (komputer) dapat melakukan pekerjaan seperti dan sebaik manusia (Kusumadewi, 2003)

Perbedaan Kecerdasan Buatan dengan Kecerdasan Konvensional
  • Pemrosesan
    • AI : Simbolik
    • Komputasi: Logaritmik
  • Input
    • AI: Biasanya tidak lengkap
    • Komputasi: Harus Lengkap
  • Pencarian
    • AI: Biasanya heuristik
    • Komputasi: Didasarkan pada algoritma
  • Fokus
    • AI: Pengetahuan
    • Komputasi: Data dan informasi
  • Kemampuan menalar
    • AI: Ya
    • Komputasi: Tidak
Yang termasuk AI:
  • Sistem Pakar
  • Pengolahan Bahasa Alami (NLP)
  • Pengenalan Pola
  • Robotika dan sistem sensor
  • Computer Vision
  • Game Playing