Verinin niteliğine dikkat edilmeli
Sektörleri ve yönettikleri toplam veri büyüklüğünden bağımsız olarak, tüm kurumların ilk dikkat etmesi gereken konu; büyüklüğünden ziyade önce verinin değeri olmalı. Kurumların ellerinde bulunan verinin bugün için değersiz ancak ileride değerli olabileceği gerçeğini kabul etmeleri gerekiyor. 1 yıl sonra az değerli statüsünde görülen veriye ihtiyaç duyulacak bir uygulama geliştirilebilir ve hatta bu uygulama sayesinde ilgili kurum yeni kazançlar elde edebilir. Buradan yola çıkarak, veri değerli veya değersiz diye tanımlamaktan vazgeçerek başlamakta fayda var. Unutulmamalı ki her veri kıymetlidir.
Belirli bir disiplin içerisinde ömür boyu objeler biriktiren koleksiyonerler gibi, kurumların da aynı disiplinde sahip oldukları veriyi doğru metotla biriktirmesi, depolaması gerekmektedir. EMC ISILON Bölge Yöneticisi Ender Bozanoğlu’nun verdiği bilgilere göre uygulama alanındaki çok hızlı gelişim, gündelik yaşamda üretilen verinin artışını da doğru orantılı etkilemektedir. Mobilitenin artması, sensör teknolojilerinin gelişmesi ve daha da yaygınlaşması, sosyal medyanın insan yaşamında kapsadığı alanın büyüklüğüne bakacak olursak, yakın gelecekte petabaytlarca veriye sahip olmanın sıradanlaşacağını göreceğiz.
Milyarlarca dosya/obje ve terabaytlarca veriyi analiz edebilmek ve bunlardan anlamlı sonuç elde etmek ise doğru altyapı kurulmadan pek mümkün olmayacaktır.
Bankacılık sektöründen bir örnek verecek olursak;
- Her gün gelen ve giden e-postalar,
- Çağrı merkezine gelen aramalar ve konuşmalar,
- Web sitesi üzerinde yapılan işlemler,
- ATM’lerden gelen bilgiler,
- Kredi kartlarından gelen veriler,
- Sosyal medyadan akan veriler,
- Mobil cihazlarda yapılan işlemler gibi birbirine benzemeyen türde ve ölçekte veriyi kullanarak davranışsal analizler yapılabilir ve kişilere özel ürün geliştirilebilir.
Bu çalışmaları yapmaya başlayan kurumlar olduğunu görüyoruz ancak disiplin eksikliğinden ötürü pek çok kurumda analiz sürecinde ciddi sıkıntılar gözlemliyoruz.
Bu ürünleri geliştirmek ve analizleri yapmak için gereken uygulamaların kullanımına verilecek donanım altyapısının hem performanslı hem de ölçeklenebilir olması gerekiyor. Performans odaklı bakıldığında, büyük veri dağınık kalabiliyor; ölçeklenebilme odaklı bakıldığında ise performanstan ödün verilebiliyor. Özetle, uygulamanın emrine verilecek donanımın, iki kabiliyete birden sahip olması çok önemli.
Saniyede; 2 milyon epostanın gönderildiği, 7000’e yakın twitter mesajının yayınlandığı, 15 bine yakın fotoğrafın paylaşıldığı günümüzde kurumların bu büyüklükte veriyi kontrol altına alabilmesi için yola doğru depolama stratejisi ile çıkmasının hayati olduğunu düşünüyoruz.