25 Mart 2010

Verilerden bilgiyi keşfetmek bağlamında veri madenciliği nedir?

Bilişim
Bilişim

 

Büyük miktarlarda ve oldukça hızlı toplanan verilerin çeşitli analizler sonucunda anlamlı bilgilere dönüştürülmesi noktasında “veri madenciliği” süreci devreye girmektedir. Veri madenciliği tanımları incelendiğinde, bu tanımlardan ortak olan unsurlardan ilki “çok fazla” miktarlarda verinin veri ambarlarında tutulması ikincisi ise bu verilerden “anlamlı” bilgiler elde edilmesidir.

 Veri madenciliği; veri ambarlarındaki tutulan çok çeşitli verilere dayanarak daha önce keşfedilmemiş bilgileri ortaya çıkarmak, bunları karar vermek ve eylem planını gerçekleştirmek için kullanma sürecidir (Swift, 2001). Bu noktada kendi başına bir çözüm değil çözüme ulaşmak için verilecek karar sürecini destekleyen, problemi çözmek için gerekli olan bilgileri sağlamaya yarayan bir araçtır.

 Veri madenciliğinde vurgulanan unsurlar istatistiğin tanımı içinde zaten yer almaktadır.  İstatistik verilerin toplanması, sınıflandırılması, özetlenmesi, grafik ve tablolarla sunulması, analiz edilerek ana kütle hakkında anlamlı bilgiler elde edilmesi ve yorumlar yapılmasıdır. Veri madenciliğinde ulaşılmak istenen amaç aslında istatistik biliminin amacı ile aynı doğrultudadır. Verilerden bilgiyi keşfetmek. Zaten veri madenciliğinde kullanılan temel aracın istatistiksel yöntemler olduğu birçok tanımda ve uygulamada vurgulanmaktadır. Her ikisinde de temel olan öğeler veri ve bilgidir. Bu nedenle birbiriyle oldukça örtüşen konulardır.

 Veri Madenciliği istatistik biliminin teknolojiyle bütünleşmesi sonucu oluşturulan bir araçtır. Uygulamada istatistiğin yeniden keşfedilmesine olanak sağlayan hiç kuşkusuz yeni teknolojilerin sunduğu fırsatlardır. Teknik olarak eskisinden çok daha fazla miktarlarda verilerin toplanması, depolanması ve hızlı bir şekilde işlenmesi mümkündür. Ancak veri madenciliğinde unutulmaması gereken önemli kavramlardan biri bunun paket programdan ibaret olmadığıdır. Her ne kadar kullanıcı için kolaylık sağlayıcı arayüzler hazırlansa da en azından temel istatistik bilgisine ihtiyaç vardır. Bu ihtiyaç elbette bu programı sağlıklı kullanmak ve isabetli kararlar alabilmek açısından önemlidir. Örneğin iki değişken arasında korelasyon bulmak istediğiniz zaman paket programın buna itiraz etme şansı olmayabilir, üstelik korelasyon derecesinin anlamlı olduğu sonucu elde edilebilir, ancak sonuç bu iki değişken arasında korelasyon katsayısının gerçekten istenen bilgi olduğu anlamına gelmez.

 “…..Veri ambarları ve veri madenciliği uygulamaları sayesinde, pazarlamacılar ile bilgi işlemciler ayrılmaz kardeşler olmaya başlamışlardır. Yepyeni bir “pazarlamacı” kavramı ortaya çıkacaktır. İstatistik ve yöneylem araştırması bilmeyen pazarlamacıların devri kapanacaktır…”

Kaynak: Yazı, Doç. Dr. Şule Özmen’in “İş Hayatı Veri Madenciliği ile İstatistik Uygulamalarını Yeniden Keşfediyor” makalesinden derlenmiştir.

 

Share

UBilişim

UBilişim Web Tasarım - Web Yazılım- Web Hosting ubilisim.com

Bunları da Beğenebilirsiniz...