İlk yazımda anlattığım İş Zekası’nın
bir alt kolu ya da bütünleyicisi olarak tanımlanabilcek veri madenciliği(data
mining), eldeki verileri değerlendirmekten ibarettir aslında. Bankalarda,
okullarda, hastanelerde ve bu gibi kurumlarda sürekli bir veri birikimi söz konusudur.
Örneğin; bir hastanede hastaların ne
gibi rahatsızlıklara sahip oldukları ya
da bir bankada müşterilerin ne tür harcamalar yaptığı bilgisi.. Veri
madenciliği teknikleri, bu sürekli olarak muhtelif yerlere kaydedilen bilginin
boş boş durması yerine değerlendirilmesi amacından ortaya çıkmıştır. Bu
vesileyle hastane kayıtlarındaki hastanın bilgisi, gelecekteki tedavilere ışık
olabilecek nitelikli bilgiye dönüşürken; banka kayıtlarındaki müşterinin bilgisi, kendi
ilgisini çekcek ve işine yarayacak fırsatlara dönüşebilir.
Şirketler, veri madenciliği
tekniklerini kullanarak veri tabanlarına kaydettikleri bilgilerin yardımıyla
müşterilerinin eğilimlerini bilebilir, hangi kampanyaların ilgilerini
çekeceğini tahmin edebilir ve buna göre
planlamalar yaparak kârını artırabilir. Nitekim yapıyorlar da. Bugün birçok
kampanya bu kurallardan elde edilen örüntülere göre oluşturuluyor. Birçok
market sahibi, müşterilerin sıklıkla beraber satın aldıkları ürünleri veri madenciliği
teknikleri ile öğrenip; raf tasarımını bile buna göre yapıyor. Daha güzel ve
benim de bu alanı sevmemi sağlayan bir örnek verecek olursak; tıp alanındaki faydalarından
bahsedebiliriz veri madenciliğinin. Geleceğe dair bilgi çıkarımı ile
tedavilerde kolaylık sağlamak ve erken teşhisi kolaylaştırmak da veri
madenciliğinin bir sonucudur. Ve bu sonuç benim için ilk örneklerdekinden daha
cazip açıkçası...
Bu anlattıklarım veri
madenciliğinin ne olduğu üzerineydi. Gelelim teknik konulara... Veri
madenciliği çalışmalarında birçok yöntem kullanılıyor. Bu yöntemlerin seçimi ise
ihtiyaca göre yapılıyor. Veri madenciliği yöntemleri o kadar çok ki hepsini
tek tek anlatmak çok uzun sürer. Zaten bunun için yazılmış kitaplar da bayağı
kalın. J
Veri madenciliği yöntemleri birçok kaynakta tanımlanmış; ancak çoğu biraz fazla
“teknik”. Ben daha açık ve anlaşılır olmak açısından aşağıdaki görsel
üzerindeki yöntemlerden bahsetmek istiyorum:
Veri madenciliği birçok dil ve
çalışma ortamı ile yapılabilir. Önemli olan gerekli algoritmaları
çalıştırabilmek ve doğru sonuçlar almaktır. Bunun için kullanılabilecek hazır
yazılımlar da var. Gerekli yazılımı yaparak çalışmak daha bilimsel olanıdır.
Biz de okulda veri madenciliği dersinde kendimiz yazılım geliştirerek sonuç
elde ettik. Ancak bu şekilde yapılan bir çalışmada önce kullanılan yönteme
uygun aracı yazmak sonra da eldeki
verilerle doğru sonuçlar elde etmek gerekir ki bu, bilimsel bir yol olur ve
şirketlerin pek işine gelmez. J
Hazır yazılım kullanarak çalışmak için de yine okulda kullandığımız “Weka”
isimli programı örnek verebilirim. Bu program sayesinde her türlü yöntem ile
çalışabilir ve kısa sürede sonuçlar alabilirsiniz. Ücretsiz bir programdır.
Veri Madenciliği konusu, yapay zeka ve makine öğrenmesi gibi konularla çok benzerdir. Bu çalışma alanlarının her biri birbirine destektir de aslında; çünkü ortak yöntemler ve çözümler içerirler. Ayrıca her yazılım ve bilgisayar bilimi konusu gibi, çok derin konulardır. Yazıma burada son verirken, ilerleyen günlerde veri madenciliği konusunda
daha ayrıntılı bir yazı yazabilmeyi umuyorum. J
Faydalı olması dileğiyle..
Faydalı olması dileğiyle..