“Büyük verinin getirdikleri”
“Petrolün ham hali, işlenmiş halinden daha az değerlidir ve bir defa işlendimi en önemli enerji kaynağına dönüşür” Bu nitelemeye koşut olarak “Data is the new Oil” deniyor!
Bu benzeştirmede ki dip anlam şöyle: Dünyamızda petrole sahip olmanın sağladığı ayrıcalık neyse, veri işleme yeteneklerine sahip kurumların ve ülkelerin kazanacakları ayrıcalık da o olacak. Burada en önemli vurgu, “veri işleme yeteneği”. Yani illa ki sahip olduğunuz, size özel ve sizin ürettiğiniz verileri işlemeniz ve değer yaratmanız gerekmiyor. Kurumun sahip olmadığı ama eklemlendiği diğer kurum dışı kaynaklardan beslenerek üretebildiği değer ölçüsünde, rekabette ve değer yaratmada bir adım önde olabileceği anlatılıyor. İşte tam bu noktada büyük veri kavramının için dolduran elementler, kurumun sahip olması gereken yetenekler de karşılığını bulmaya başlıyor.
Büyük verinin kurumlara ne sağlayacağının somut uygulamalarını çeşitli sektörlerde görüyoruz.
Güvenlik alanında, ses ve görüntü analizleri saatlerden dakikalara geriledi; sağlık alanında hasta ve hastalık analizleri çok hızlandı; Finans analizlerinde PB’lık verilerin analizi saatlerden dakikalara düştü; operatörler ağ üzerinden akan veri analizi (Stream Computing) yaparak donanım maliyetlerini yüzde 90 oranında azaltıyorlar.
Öncelikle, kurulması hedeflenen büyük veri platformu, yeni bir veri ambarı olmamalı. Büyük veri platformunu, veri ambarından ayıran en önemli özellik, işlenen verinin bir yerde yüklenmiş olmasının gerekmemesi, verinin kaynağında işlenerek kuruma ham haliyle değil, karar sürecini etkileyecek bilgiye dönüşmüş veya dönüşmeye hazır olarak ulaşması. Bir kurumun bu yeteneklere erişmesi için mevcut işleme ve veri ambarı sistemlerinin yanına neler eklenmesi gerekiyor veya bir başka deyişle büyük veri platformu nelerden oluşmalı
1) 3V’yi yani Volume (Büyüklük), Velocity (Hız) ve Variety (Çeşitlilik), yönetebilmeli. Temel veri kaynaklarından bazıları, geleneksel işlemsel sistemler, makinelerin ürettiği duyarga verileri, sosyal medya verileri, yapısal olmayan bilgi içeren doküman yönetim sistemleri kaynakları ilk akla gelenler.
2) Hareket halindeki veriyi analiz edebilmeli (Stream Computing). Ürettiğimiz verinin yüzde 80’inin yapısal olmadığı düşünülürse bu veriyi kaynağında analiz edecek yetenekleri olmalı.
3) Hızlı uygulama geliştirme için araçları ve ön yüzleri bulunabilmeli. Hadoop ve Mapreduce temelli açık kaynak kodlu teknolojileri kesinlikle desteklemeli.
4) Kurumsal düzeyde güvenlik, yönetişim ve veri bütünleştirme arayüzleri olmalı. Mevcut kurumsal veri kaynakları ile bütünleşik çalışan, veri kalitesini iyileştirici, MDM (Master Data Management) çözümü ile bütünleşik çalışabilmeli.
Geleneksel İş Analizi uygulamaları, önceden tasarlanmış sistemlerde, toplanmış ve yüklenmiş veriler üzerinden, iş analistlerinin belirlediği soruların cevaplarını arayan sistemlerdir. Büyük veri analiz ortamları ise veri kaynaklarının ve tiplerinin çeşitliliği, dağınıklığı ve büyüklüğü yüzünden bir platform olarak kullanıcının hizmetine ve yaratıcılığına sunulur.
Kurulacak büyük veri platformu işinize ne katabilir?
• Müşterileriniz hakkında her şeyi, sosyal medya hareketlerinden kanallarınız üzerinden sizinle kurduğu bütün etkileşime kadar, topyekün ve bireysel olarak bilmenizi sağlar. Ürün promosyonlarının yönetilmesi, karlılık analizi bunlardan bazıları.
• Operasyonel verilerle birlikte olmak şartıyla, süreçlerin optimize edilmesinde, karar verme sistemlerinin sıfır gecikmeyle gerçek zamanlı analiz yapabilmesini sağlar. Gerçek zamanlı satış raporlama ve analiz uygulamaları, bölgesel kampanya analizleri, doğal afetlerde etki ölçme uygulamaları sayılabilir.
• Veri kaynaklarınızı ve kuruma yapılan geri dönüşleri işleyip, “ışık hızında” yeni ürünler üretmenizi, proaktif kurumsal davranış geliştirebilmenizi sağlayacak olanaklar sunar. Sosyal medya, marka ve piyasa etkileşim analizleri, RFID izleme uygulamaları ilk akla gelenlerden bazılarıdır.
• Kurumla ilgili bütün verileri, kurumda yüklenmemiş olsa bile, akan veri analizi teknikleri ile işleyerek, hile ve risk analiz modellerini çalıştırabilmeli. “Hile” algılama ve aksiyon alma, siber güvenlik, risk yönetimi bunlardan bazıları.
• “Acaba işime yarar mı?” diye saklanagelen ve çok nadiren erişilen, saklama maaliyetleri yüksek veri ambarlarını tutmak yerine, veriyi kaynağında işleyerek veri ambarı işletim maliyetlerinin düşmesini sağlamalı. Ağ loglarının anlık analizi, web sitesi erişim, kullanım analizleri düşünülebilir.
Büyük veri yeni bir platform ve veri işleme anlayışı getirmesinin yanında, BT ortamında yeni ve daha karmaşık beceri kümelerinin oluşmasını şart koşuyor. “Data Scientist- Veri Bilimci” bu anlamda yeni bir rol. Veri Bilimcisi, istatistik, bilgisayar bilimleri ve MBA’in birleşiminden oluşacak. Bu rolün en önemli çalışma prensibi “Gerçek Zamanlı” çözümler üretebilme yeteneklerinin olması. Bir örnekle açıklamaya çalışırsak; buzdolabınız bozulduğunda, gazeteyi açıp bir buzdolabı tamircisi ilanından bakarak ustayı çağırdığınızda çoktan geç kalmışsınız demektir. Ama bozulan buzdolabı ustayı arayıp yardım isteyebiliyor veya bir problem kaydını sizin adınıza satıcı şirkete açabiliyorsa, kullandığınız ürün gerçek zamanlı bir çözüm sağlar. “Veri Bilimcisi”, kurumun veri kaynakları ve bunlar arasındaki etkileşimi bilerek, kurumun iş geliştirme stratejilerine uygun, büyük veri platformunun yeteneklerini de birleştirerek anlık analiz çözümleri üretebilen bir yeni rol olarak hayatımızda yerini almaya hazırlanıyor. Veri Bilimcisi, uçtan uca, kullanıcının ilk sorularıyla başlayan “merak” sürecinden, geliştirme ve dağıtıma kadar ki süreci yönetebilmelidir. İş ile ilgili soruları, kurumun veri kaynakları ile ilişkilendirecek kadar büyük fotoğrafı kavrayabilmelidir.
Gartner’a göre 2013’teki BT harcamaları 3.7 trilyon doları bulacak ve 2015’e kadar büyük veri ihtiyaçları için 4.4 milyon yeni iş olanağı doğacak.
Büyük veri kavramını özümseyerek, bu yolda insana, platforma ve teknolojiye yatırım yaparak, iş süreçlerini bu kavrama uyarlayan, “büyük düşünen” kurumlar, diğerlerinden bir adım önde olacak.