“Büyük veri”nin önemi, önümüzdeki yıllarda artacak!
Sağlıktan finansa, eğitimden ticarete kadar pek çok alanda “büyük veri” yaygın şekilde kullanılıyor. Uzmanlar, “büyük veri”nin öneminin ne kadar fazla veriye sahip olunduğu ile değil, bu verinin nasıl verimli kullanıldığı ile ilgili olduğuna dikkat çekiyor. Öyle ki büyük veriyi kullanan şirketler, %50 daha fazla kazanç elde ediyor, pazar çalışmalarında %41 etkili oluyor, reklam harcamaları %37 azalıyor. Uzmanlar, dünyanın yeni ve sonsuz kaynağı olarak son yıllarda toplanan, işlenen ve ticari değeri olan “büyük veri”nin önümüzdeki yıllarda öneminin artacağına dikkat çekiyor.
Üsküdar Üniversitesi Mühendislik ve Doğa Bilimleri Fakültesi Yazılım Mühendisliği Bölüm Başkanı, Yapay Zeka ve Akıllı Sistemler Uygulama ve Araştırma Merkezi (YAZAMER) Müdürü Doç. Dr. Türker Tekin Ergüzel, günümüzde pek çok alanda öne çıkan büyük veri kavramına ilişkin değerlendirmede bulundu.
Sonsuz ve yenilenebilir kaynak: Veri
Doç. Dr. Türker Tekin Ergüzel, büyük verinin temel olarak toplanan yapılandırılmış veya yapılandırılmamış verinin hacimsel büyüklüğünü ifade ettiğini kaydederek “Günümüzde birçok alanda toplanan verinin çözünürlüğünün de artması ile birlikte bu verilerin analizini yapan sistemler için büyük veri sağlık, finans, eğitim, ticaret alanlarında yaygın kullanılmaktadır. Burada esas olan aslında verinin hacimsel büyüklüğünden değil bu verinin analizi sonrasında elde edilen sonuç ve stratejik karar verme öncesi sağladığı öngörü becerisidir” dedi.
Büyük veriyi kullanan şirketler daha fazla kazanıyor
Sağlık hizmetlerinin iyileştirilmesinde büyük verinin kullanılmasının büyük katkı sağladığını kaydeden Doç. Dr. Türker Tekin Ergüzel, “Veri odaklı tıp, hastalıkların erken teşhisi, tedavi sonucunun öngörülmesi ve biyo-belirteçlerin ortaya çıkarılmasına katkı sağlayacak analiz yöntemlerini kullanmaktadır. Araştırmalara göre büyük veriyi kullanan şirketler; %50 daha fazla kazanç elde etmiş, pazar çalışmalarında %41 etkili olmuş, reklam harcamaları %37 azalmış ve sosyal medya kullanımında %37 gibi yüksek oranlarla daha başarılı olmuşlar” diye konuştu.
Büyük verinin üç temel özelliği var
Büyük verinin temel özelliklerini; yüksek hacim, yüksek hız ya da fazla çeşitlilik olarak sıralayan Ergüzel, şunları söyledi:
“Bu özelliklere sahip verinin ham yani işlenmemiş haliyle bir değeri yoktur. Bu verinin istatistiksel yöntemleri makine öğrenmesi, derin öğrenme gibi veri analiz yöntemleri ile anlamlandırılması esastır. “Büyük veri” kavramını geleneksel “veri” kavramından ayıran temel özellik verinin daha hızlı, daha yüksek çözünürlüklü ve daha yaygın toplanması ve sonrasında da daha hızlı fiziksel sistemler tarafından yeni veri analiz yöntemleri ile işlenmesi ve öngörü modellerinin ortaya çıkarılmasıdır.”
Büyük veri kavramının hayatımıza 2000’li yılların başında analistlerin tanımladığı üç temel kavram ile yeni akım tanımlamalarda yaygın kullanıldığını kaydeden Doç. Dr. Türker Tekin Ergüzel, şu bilgileri verdi:
Hacim : İşletmeler; ticari işlemler, akıllı (IoT) cihazlar, endüstriyel donanımlar, videolar, sosyal medya ve daha fazlası dâhil olmak üzere çeşitli kaynaklardan veri toplarlar. Geçmişte, bunu depolamak bu kadar kolay değildi günümüz platformları ile büyük verinin saklanması artık daha kolay.
Hız : Nesnelerin interneti ve bu alanda kullanılan ve veri sağlayan cihazların yaygınlaşması ile birlikte veri transfer hızları da artış göstermiştir. Bu hız, anlık verinin işlenme hızınında artması sonucunu doğurmuştur.
Çeşitlilik: Veriler, geleneksel veri tabanlarındaki yapılandırılmış sayısal verilerden yapılandırılmamış metin belgelerine, e-postalara, videolara, seslere, hisse senedi verileri ve finansal işlemlere kadar her tür biçimde elde edilir. Bu veri çeşitliliği yukarıda sayılan hacim ve hız ile birlikte kıymetli verinin seçimini de beraberinde getirmektedir. Bu aşamada özellik seçim ve öznitelik azaltma algoritmaları kullanılmaktadır.
Büyük verinin önemi, verimli kullanımı ile ilgilidir
“Büyük verinin önemi ne kadar fazla veriye sahip olunduğu ile değil, bu verinin nasıl verimli kullanıldığı ile ilgilidir” diyen Ergüzel, “Düşük maliyet (1), hızlı karar veren sistem (2), yüksek doğruluklu öngörü modelleri ve optimize edilmiş modeller ve (3) akıllı sistemler (4) ile farklı veri kaynaklarından toplanan veriler önişleme, öznitelik belirleme ve modelleme süreçlerini takiben oluşturulur. Büyük veri analizinde yaygın olarak derin öğrenme algoritmaları kullanılmaktadır. Bu algoritmalar daha iyi performans için büyük veriye ihtiyaç duyarlar ve veri sayısı arttıkça “tecrübeli” sistemler daha iyi sistem cevabı üretirler” diye konuştu.
Büyük veri nasıl çalışır?
Doç. Dr. Türker Tekin Ergüzel, büyük veri analizleri öncesi verinin toplandığı kaynakların standartları, çözünürlükleri gibi özellikleri ile yapılandırılmamış, yarı yapılandırılmış veya yapılandırılmış verileri yönetmenin beş önemli adımı olduğunu kaydetti.
1-Büyük veri stratejisi belirlemek
Yüksek düzeyde, büyük veri stratejisi, veritabanınız içinde ve dışında verileri elde etme, depolama, yönetme, paylaşma ve kullanma şeklinizi denetlemenize ve iyileştirmenize yardımcı olmak için tasarlanmış bir plandır. Büyük veri stratejisi, bol miktardaki veri sürecinde iş başarısı için gerekli zemini belirler. Bir strateji geliştirirken, mevcut – ve gelecekteki – iş ve teknoloji hedeflerini ve girişimlerini dikkate almak önemlidir. Bu, büyük veriyi sadece uygulamaların bir yan ürünü olarak değil, diğer tüm değerli ticari varlıklar gibi ele almayı gerektirir.
2-Büyük verinin kaynaklarını bilmek
Akış verileri, Nesnelerin İnternetinden (IoT) ve giyilebilir cihazlar, akıllı arabalar, tıbbi cihazlar, endüstriyel ekipmanlar vb. gibi BT sistemlerine akan diğer bağlı cihazlardan elde edilir. Bu büyük verileri elde edildikçe analiz edebilir, hangi verilerin saklanıp saklanmayacağına ve hangilerinin daha fazla analiz edilmesi gerektiğine karar verebilirsiniz.
Sosyal medya verileri Facebook, YouTube, Instagram vb. üzerindeki etkileşimlerden kaynaklanır. Bu, pazarlama, satış ve destek işlevleri için yararlı olan görseller, videolar, ses, metin ve ses biçiminde büyük miktardaki büyük veriyi içerir. Bu veriler genellikle yapılandırılmamış veya yarı yapılandırılmış biçimdedir, bu nedenle tüketim ve analiz için benzersiz bir zorluk oluşturur.
Halka açık veriler, ABD hükümetinin data.gov, CIA Dünya Gerçekleri Kitabı (CIA World Factbook) veya Avrupa Birliği Açık Veri Portalı gibi büyük miktarlarda açık veri kaynaklarından gelir.
Diğer büyük veriler, Veri göllerinden, bulut veri kaynaklarından, tedarikçilerden ve müşterilerden gelebilir.
3-Verilere erişmek, yönetmek ve depolamak
Modern bilgi işlem sistemleri, çok büyük miktarlarda ve türde büyük verilere hızla erişmek için gereken hızı, gücü ve esnekliği sağlar. Güvenilir erişimin yanı sıra, şirketler ayrıca verileri entegre etmek, veri kalitesini, veri yönetimini ve depolamayı sağlamak ve verileri analiz için hazırlamak amacıyla yöntemlere ihtiyaç duyar. Bazı veriler kuruluş içinde geleneksel bir veri ambarında depolanabilir, ancak büyük verileri bulut çözümleri, veri gölleri ve Hadoop aracılığıyla depolamak ve işlemek için esnek, düşük maliyetli seçenekler de vardır.
4-Verileri analiz etmek
Dağıtımlı hesaplama (Grid computing) veya bellek içi analizi gibi yüksek performanslı teknolojilerle, kuruluşlar tüm büyük verilerini analizler için kullanmayı seçebilirler. Diğer bir yaklaşım, analiz etmeden önce hangi verilerin alakalı olduğunu önceden belirlemektir. Her iki durumda da büyük veri analizi, şirketlerin verilerden nasıl değer ve öngörü kazandıklarıdır. Büyük veri, günümüzün yapay zekâ gibi gelişmiş analiz girişimlerini giderek daha da fazla beslemektedir.
5-Veriye dayalı kararlar almak
İyi yönetilen güvenilir veriler, güvenilir analizlere ve güvenilir kararlara yol açar. Rekabetçi kalmak için işletmelerin büyük verinin tam değerini anlaması ve veriye dayalı bir şekilde çalışması, içgüdülerden ziyade büyük verinin sunduğu kanıtlara dayalı kararlar vermesi gerekir. Veri odaklı olmanın faydaları açıktır. Veri odaklı kuruluşlar daha iyi performans gösterir, operasyonel olarak daha öngörülebilir ve daha kârlıdır.
Büyük veri, geleceğin mesleklerini belirleyecek
Doç. Dr. Türker Tekin Ergüzel, dünyanın yeni ve sonsuz kaynağı olarak son yıllarda toplanan, işlenen ve ticari değeri olan “büyük veri”nin önümüzdeki yıllarda öneminin artacağını belirterek bu alanda yazılım mühendisleri, yapay zeka mühendisleri, veri analistleri öne çıkan meslekler olarak dikkat çekeceğini kaydetti.