5 Eylül 2012 Çarşamba

Veri Madenciliği / Data Mininig

İlk yazımda anlattığım İş Zekası’nın bir alt kolu ya da bütünleyicisi olarak tanımlanabilcek veri madenciliği(data mining), eldeki verileri değerlendirmekten ibarettir aslında. Bankalarda, okullarda, hastanelerde ve bu gibi kurumlarda sürekli bir veri birikimi söz konusudur. Örneğin;  bir hastanede hastaların ne gibi rahatsızlıklara sahip oldukları  ya da bir bankada müşterilerin ne tür harcamalar yaptığı bilgisi.. Veri madenciliği teknikleri, bu sürekli olarak muhtelif yerlere kaydedilen bilginin boş boş durması yerine değerlendirilmesi amacından ortaya çıkmıştır. Bu vesileyle hastane kayıtlarındaki hastanın bilgisi, gelecekteki tedavilere ışık olabilecek nitelikli bilgiye dönüşürken;  banka kayıtlarındaki müşterinin bilgisi, kendi ilgisini çekcek ve işine yarayacak fırsatlara dönüşebilir.
Şirketler, veri madenciliği tekniklerini kullanarak veri tabanlarına kaydettikleri bilgilerin yardımıyla müşterilerinin eğilimlerini bilebilir, hangi kampanyaların ilgilerini çekeceğini tahmin edebilir  ve buna göre planlamalar yaparak kârını artırabilir. Nitekim yapıyorlar da. Bugün birçok kampanya bu kurallardan elde edilen örüntülere göre oluşturuluyor. Birçok market sahibi, müşterilerin sıklıkla beraber satın aldıkları ürünleri veri madenciliği teknikleri ile öğrenip; raf tasarımını bile buna göre yapıyor. Daha güzel ve benim de bu alanı sevmemi sağlayan bir örnek verecek olursak; tıp alanındaki faydalarından bahsedebiliriz veri madenciliğinin. Geleceğe dair bilgi çıkarımı ile tedavilerde kolaylık sağlamak ve erken teşhisi kolaylaştırmak da veri madenciliğinin bir sonucudur. Ve bu sonuç benim için ilk örneklerdekinden daha cazip açıkçası...
Bu anlattıklarım veri madenciliğinin ne olduğu üzerineydi. Gelelim teknik konulara... Veri madenciliği çalışmalarında birçok yöntem kullanılıyor. Bu yöntemlerin seçimi ise ihtiyaca göre yapılıyor. Veri madenciliği yöntemleri o kadar çok ki hepsini tek tek anlatmak çok uzun sürer. Zaten bunun için yazılmış kitaplar da bayağı kalın. J Veri madenciliği yöntemleri birçok kaynakta tanımlanmış; ancak çoğu biraz fazla “teknik”. Ben daha açık ve anlaşılır olmak açısından aşağıdaki görsel üzerindeki yöntemlerden bahsetmek istiyorum:
Veri madenciliği yöntemleri öncelikle öğreticili/denetimli ve öğreticisiz/denetimsiz yöntemler ve market sepeti analizi olarak üçe ayrılır. Daha sonraki aşamada ise öğreticili/denetimli öğrenme, en yakın komşu yöntemi, k-ortalamalar yöntemi, regresyon yöntemi, karar ağaçları, sinir ağları gibi yöntemlere sahiptir. Öğreticisiz/denetimsiz öğrenme ise hiyerarşik kümeleme ve kendi kendini organize eden haritalar gibi yöntemlere sahiptir. Bu yöntemlerden k- en yakın komşu yöntemi, karar ağacı yöntemi ve market sepet analizi yöntemi en sık kullanılanlardır. Bu yöntemlerin her birinin kendine özgü özellikleri ve uygulanma şekli ile algoritmaları vardır.
Veri madenciliği birçok dil ve çalışma ortamı ile yapılabilir. Önemli olan gerekli algoritmaları çalıştırabilmek ve doğru sonuçlar almaktır. Bunun için kullanılabilecek hazır yazılımlar da var. Gerekli yazılımı yaparak çalışmak daha bilimsel olanıdır. Biz de okulda veri madenciliği dersinde kendimiz yazılım geliştirerek sonuç elde ettik. Ancak bu şekilde yapılan bir çalışmada önce kullanılan yönteme uygun aracı yazmak sonra da  eldeki verilerle doğru sonuçlar elde etmek gerekir ki bu, bilimsel bir yol olur ve şirketlerin pek işine gelmez. J Hazır yazılım kullanarak çalışmak için de yine okulda kullandığımız “Weka” isimli programı örnek verebilirim. Bu program sayesinde her türlü yöntem ile çalışabilir ve kısa sürede sonuçlar alabilirsiniz. Ücretsiz bir programdır.
Veri Madenciliği konusu, yapay zeka ve makine öğrenmesi gibi konularla çok benzerdir. Bu çalışma alanlarının her biri birbirine destektir de aslında; çünkü ortak yöntemler ve çözümler içerirler. Ayrıca her yazılım ve bilgisayar bilimi konusu gibi, çok derin konulardır. Yazıma burada son verirken, ilerleyen günlerde veri madenciliği konusunda daha ayrıntılı bir yazı yazabilmeyi umuyorum. J

Faydalı olması dileğiyle.. 

Hiç yorum yok:

Yorum Gönder