Açık Büyük Veri Türkiye – 1
Açık verileri işleyip bunları değere dönüştürenler, ekonomiye katanlar, bunun ekonomisini oluşturanlar gelişmiş beyinlere sahip ülkelerdir
*Prof. Dr. Şeref Sağıroğlu
Açık Kaynak, Açık Toplum, Açık Bilim, Açık Veri, Açık Türkiye son dönemde üzerinde konuşulan konuların başında geliyor.
Açık veya açıklık, kişiler,.. toplumlar veya ülkeler için önemli. Gelişim ve değişim için şart. Konuşulması, paylaşılması, okunulması veya anlatılması bile pozitif bir etki bırakıyor insanın üzerinde… Toplumda güven duygusunu artıran önemli bir etkisi var… Güven veriyor… Bugünlerde buna çok ihtiyacımız var doğrusu…
Açık Bilgi Vakfı (Open Knowledge Foundation) açık veriyi, “Hherhangi bir telif hakkı, patent ya da herhangi bir kontrol mekanizmasına tabi olmaksızın herkes tarafından ücretsizücretsiz ve özgürceözgürce kullanılan veri” olarak tanımlamaktadır. Diğer bir ifadeyle “Hherkes tarafından ücretsiz ücretsiz olarak erişilebilenişilebilen, tekrar kullanılabilen ve paylaşpaylaşılabilen araştırma ılabilen araştırma veya gözlem sonuçlarıgözlem sonuçları” açıkaçık veri olarakta ifade edilmektedir. Aynı zamanda, Açık Bilgi Vakfı “Aaçık devlet verisini” ise “Ddevlet ya da devlet kontrolüündeki birimler tarafından uü̈retilen, herkes tarafından kullanabilen ve paylaşılabilen veriler” olarak tanımlamaktadır.
Dünyaya baktığımızda; bu kelimeleri konuşan, bunları hayatın içerisine alan, bu konuda çalışmalar yapan, verilerini, dokümanlarını, yaptıklarını ve bunların değerlerini bilen ve koruyan, paylaşılması gereken bilgilerini ise topluma açan veya bunları geniş kitlelerle paylaşanlar gelişmiş toplumlardır. Açık verileri işleyip bunları değere dönüştürenler, ekonomiye katanlar, bunun ekonomisini oluşturanlar ise gelişmiş beyinlere sahip ülkelerdir.
Sümerler’den günümüze kadar geçen uygarlıkları incelediğimizde, bu açıklık ile hareket eden toplumların büyüdükleri, felsefelerini yaygınlaştırdıkları ve sonuçta geliştiklerini tarih bize söylemektedir. Osmanlı İimparatorluğu’nun büyüme felsefesinin arkasında da bu vardır. Bugün büyük dünya devletlerinin büyüklüğünün arkasında da bu vardır. Doğal olarak; bu büyüklük, şeffaflıkla ve açıklıkla sağlanabilmektedir. Bu sayede güven artmaktadır. Destekler çoğalmaktadır. Toplumların veya ülkelerin ortak hedeflere koşması veya kilitlenmesi de artmaktadır. Google, Wikipedia, Scholarpedia, GoogleScholar, Facebook, Twitter, Über, TEDTalks, vb ürünler veya ortamlar bunlara verilebilecek iyi örneklerdir. Bu açıklığın ekonomik sonuçları ise Milyar milyar dolarlık şirketler, zengin ekonomiler, gelişmiş ekonomiler, bilgi toplumları, sosyal projeler, milyarları etkileyen olaylar, değişimler ve sonuçlardır.
Dünya üzerinde büyük etki yaratan uygulamaların sayısını artırmak için; büyük etkiler oluşturabilecek büyük fikirleri geliştirmek, projeleri hayata geçirmek, açık ortamları oluşturmak, paylaşmak, yenilerini düşünmek ve özellikle de bunda ısrar etmek gereklidir.
Ülke olarak açık veriye baktığımızda; bu yönde geliştirdiğimiz büyük projelerin sayısı maalesef azdır. Bunu artırmanın yolu; gelişimin önündeki engellerin kaldırılması, açık bilgiye erişşimin yeterli düzeye getirilmesi, üretilen bilginin niteliğğinin ve kapsamının genişletilmesi, teknoloji ve inovasyon kültürünün gelişmesi, yerli ve milli ürünlerin sayılarının artırılması, toplumun hızla gelişip kalkınması, bilgi toplumu ve ekonomisine geçişin hızlandırılmasından geçmektedir. Bundan dolayı, gelişmisgelişmiş̧ toplumlar veya ülkeler açık kaynak ve veri yaklaşımlarını desteklemekte, kamu kaynaklarıyla desteklenen projeleri, yayınları, araşştırmaları, raporları, araştırma verilerini herkese açmakta, bunun için yasal duü̈zenlemeler yapmakta, bu tür projeleri teşşvik etmekte ve bunların hayata geçirilmesine kolaylıklar göstermektedir.
Büüyüük ve açık verilerin öönemli bir kısmı kamu hizmetlerinden elde edilen verilerdir. Bu verilerin işlenmesi ve elde edilen değerlerin toplumun yararına kullanılması için sahip olunan bazı verilerin kullanıma veya analize aççık olması, farklı kurumlar ve birimler tarafından kullanılabilmesi, farklı ve yeni fikirlerin ve çıktıların elde edilebilmesinin yanında girişşimciliğği ve inovasyonu teşvik etmesi, kurumların verimliliğini artırması, kurumlararasıkurumlar arası işbirliğini güçlendirmesi, oluşabilecek ihlallerin tespit edilmesini kolaylaştırması, kayıpları en aza indirgemeye katkı sağlaması, aççık verilerden farklı kazanımların elde edilmesi ve bunların vatandaşlara ve yöneticilere aktarılması işlemlerini sağlayacak ve işleri kolaylaştıracaktır.
Akademik ortamlarda “Aççık Erişşim”; yaklaşıkyaklaşık 10 yıldır yoğunyoğun olarak ülkemizde tartışılmakta ve bugünbugün dünyadadünyada pek ççok bilim insanı, araştırmacıaraştırmacı, yayınevi, kurum ve kuruluşlar tarafından desteklenmektedir.
BudapeşteBudapeşte AçıkAçık ErişimErişim Girişimi Bildirgesinde; Açık Erişim “verilerin okunabilir, kaydedilebilir, erişilebilirerişilebilir, kopyalanabilir, yazdırılabilir, taranabilir, dizinlenebilirdizginlenebilir, bağlantıbağlantı verilebilir, başka bir ortama veri olarak aktarılabilir ve her türluturlü amacamaç̧ içiniçin yasal çerçevede kullanılabilir olması ve ekonomik, hukuki ve teknik engellemeler olmaksızın kamuya ücretsiz olarak açık bulunması” olarak tanımlanmaktadır.
Büyük veri, günümüzde gerek akademik ortamlarda gerekse sektörlerde ve kurumlarda önemli ve popüler konularından biridir. Büyük veri; depolama, yönetim ve analiz iççin sıradan veri tabanı yazılım araçlarının yeteneklerinin gerisinde kaldığı veri kümesi, yüksek hızda toplama, keşif ve analiz sayesinde çok çeşitli verinin çok büyük hacminden ekonomik olarak değer elde etmek için tasarlanan yeni nesil teknolojiler ve mimariler, geleneksel veri işleme uygulamaları veya genel veri tabanı yönetim araçları kullanılarak yönetilmesi zor olan büyük ve karmaşık veri koleksiyonu, farklı formatlarda ve farklı kaynaklardan çok yüksek hızlarda üretilen büyük miktardaki veriler, gibi tanımlamaları olsa da aslında güncel teknolojiler ile çözülemeyen problemlerin çözümünde kullanılabilecek yeni nesil çözümlerdir. Bu verilere, hız, hacim, ççeşitlilik, güvenilirlik ve değer olmak üzere beş temel karakteristiğe (5V Özelliği) sahip olsa da buna yeni özelliklerde eklenmektedir (11V Özelliği). Bu temel karakteristikler, verilere ve veri işleme yaklaşımlarımıza bakış açımızı değiştirmekte, pek çok şeyi tekrar sorgulamamıza, yeni yaklaşımlar geliştirmemize ve en önemlisi bir verinin ne kadar hacimli olduğuna , ne kadar hızlı değiştiğine, ne kadar çeşitli olduğuna, ne denli güvenilir olmasına daha çok dikkat etmemize ve en önemlisi de bu verilerden yeni değer nasıl elde edilebilir odaklanmamızı sağlamaktadır.
Verilerin mahremiyetinin sağlanmasına yönelik, çeşitli anonimleştirme teknikleri ve çözümleri mevcuttur. Bu teknikler, en temelde kayıt bağlama, özellik bağlama, tablo bağlama ve olasılık saldırılarına karşı koruma sağlamaktadır. Burada verilere yapılabilecek olası saldırıların veya oluşabilecek açıkların önceden fark edilmesi veya belirlenmesi , ve sonuçta bu oluşabilecek ihlallerin engellenmesi için anonimleştirme tekniklerinin önemi büyüktür. İstenilen anonimleştirme seviyesi sağlanmadan paylaşılan veri kümelerinin saldırıya ve ihlale açık olduğu bilinmektedir. Buna en iyi örnek, 2006 yılında AOL firması tarafından çeşitli araştırma faaliyetleri için, kullanıcı kimliği ve IP numarası silinerek 650 kullanıcıya ait 20 milyon arama sorgu verisi paylaşılmış, ancak birkaç gün içerisinde bu sorguların kimlere ait olduğu araştırmacılar tarafından tespit edilmiştir. Buna benzer başka örneklerde literatürde mevcuttur. Karşılaşılan bu ihlaller araştırmacılara yol göstermiş olup, bu tür ihlallerin önlenmesine yönelik yeni ve farklı çözümler geliştirmektir.
2016 yılında yayınlanan Kişisel Verileri Koruma Kanunu’nda anonimleştirme, “Kkişisel verilerin, başka verilerle eşleştirilerek dahi hiçbir surette kimliği belirli veya belirlenebilir bir gerçek kişiyle ilişkilendirilemeyecek hale getirilmesi”, kişisel veri ise “kimliği belirli veya belirlenebilir gerçek kişiye ilişkin her türlü bilgi” olarak tanımlanmıştır. Bu tanımlara dayanarak, kişisel veri sınıfına giren büyük verilerin mahremiyeti belirtilen kanun çerçevesinde gerek işlenmesi ve saklanması gerekse aktarılması veya ifşa edilmesi konularında çalışmalar vardır.
Avrupa Birliği;
Kkamu bilgilerinin Avrupa'daki en büyük veri kaynağı olduğunu ve bunların ise sayısal haritalar, meteorolojik, yasal, trafik, mali, ekonomik ve diğğer verilerden oluştuğunu belirtmiş, bu verilerin ççoğğunun yeniden kullanılabilir olduğunu, hava, finans ve sigorta kuruluşları gibi kurumların yeni ürün ve hizmetlerine entegre edilebileceğini”, verilerin altın olduğunu ve bunun keşfedilmesi, işlenmesi ve değere dönüştürülmesini, açık verileri petrole benzetmiş ve dijital çağda verilere önem verilmesi gerektiğini raporlamış,
Kendi büyük verisini oluşturmak ve “Açık Erişim Arşivlerini” kurmak için H2020 çerçeve programı kapsamında “OpenAIREplus” projesini destekleyerek, 10 milyonun üzerinde doküman, yayın ve verileri bu sisteme aktarılmasını sağlamış,
CERN ev sahipliğinde oluşturulan açık veri arşivi ZENODO (http://zenodo.org/) ile istenilen büyüklükte veriyi tüm ülkelerin kullanımı için arşivlenmektedir. me hizmeti altyapısını kurmuştur.Bunun gerekçelerini ise büyük verilerden farklı ve yeni değerlerin elde edilebilme ve Avrupa toplumlarının bu gelişmelerden daha çok faydalanmasını sağlamak ve kendi ekosistemini kurmaktır.
Nicol, Caruso ve Archambault tarafından 2013’de hazırlanan “Avrupa Araştırma Alanları ve Ötesi: Açık Veri Erişim Politikaları ve Stratejileri” dokümanında sunulan verilere göre;
ABD’nin bu alana yılda 60 milyar dolar harcadığı,
AB’nin FP7 projeleri kapsamında bu konunun gelişmesi için 50 milyar avroluk harcama planladığı,
AB’de H2020 için 70 milyar avro araştırma bütçesi kullanılacağı,
Yıllık veri artışının ise yüzde 30 civarında gerçekleştiği,
Büyük verilerin, açık veri haline getirilmesiyle AB ülkelerinin bundan yılda 150-300 milyar avro tasarruf sağlanabileceği belirtilmiştir.ABD, İspanya, Almanya, Kanada, Japonya, Yunanistan, İtalya vb. ülkeler kamu kaynaklarıyla desteklenen araştırma çıktılarının açık erişim olarak paylaşılmasını zorunlu hale getirmişlerdir. Günümüzde pek çok uluslararası üniversite açık erişimi, araştırmacıların destek alabilmelerinde ve akademik yükseltmelerde ön koşul olarak sunmaktadır.
Ülkemizdeki durumları incelediğimizde ise;
Ülkemizde açık erişim çalışmaları 2006 yılında başlamış, ülkemizde açık erişim arşivi ve kültürünün oluşturulmasına katkı sağlamak ve kazanılan tecrübeleri paylaşmak amacıyla ANKOS (Anadolu Üniversite Kütüphaneleri Konsorsiyumu) çatısı altında Açık Erişim ve Kurumsal Arşivler (AEKA) adıyla bir çalışma grubu kurulmuştur. Bu grup çalışmalarını sürdürmektedir.
Ülkemizde 120’nin üzerinde üniversitenin açık erişim yaklaşımlarını destekledikleri, bazılarının ise bunu senato kararı alarak daha da somutlaştırmışlardır.
World Wide Web Foundation tarafından yıllık olarak yapılan bir araştırma sonucunu incelediğimizde, ülkelerdeki açık verileri sınayan Open Data Barometer listesinde ülkemiz bu yıl 40. sıradadır. Bu sıralamanın ise hazır olma (readiness), uygulama (implementation) ve etki (impact) kriterleri dikkate alınarak belirlendiği, ülkemizin ise 100 üzerinden 3 kriter için sırasıyla 35, 53 ve 15 puan aldığı görülmüştür.
Ülkemiz için internette açık veri ile ilgili küçük bir araştırma yapıldığında, bazı belediyelerin bu tür platformları açtığı fakat içerisinde herhangi bir bilginin bulunmadığı, devletin bu konudaki domain isimlerini (www.data.gov.tr) aldığını fakat bunların içeriğinin olmadığı görülebilir.
Ülkemizde, iyi örneklerimizin de olduğunu belirtmekte fayda vardır. Açık kaynak ve açık veri konusunda YÖK, TÜBİTAK ve üniversiteler iyi örneklere sahiptir.
Kurumsal Akademik Arşivler ve Ulusal Akademik Arşiv sistemlerinin kurulması için 2014 yılında kamu kaynaklarıyla yapılan projeler ve araştırmalar sonucunda üretilen yayınların açık erişim olarak sunulması, açık erişim politikalarının oluşturulması için bir proje hayata geçirilmiş ve şu an için Yüksek Öğretim Bilgi Yönetim Sistemi (https://istatistik.yok.gov.tr) ile tüm öğretim elemanlarının yaptığı çalışmaların neler olduğunu ve ilgi alanlarını genelde ve özelde görebilmek için geliştirilen “Yükseköğretim Akademik Arşiv Projesi” (http://akademik.yok.gov.tr) portalları üzerinden açık bilgiye erişim kanallarını açılmıştır.
Üniversitelerimiz bu konuya en yakın desteği veren kurumlar olduğu ve son on yıldır bu konuya çok önem verildiği, 100’ün üzerinde üniversite web siteleri altında, açık arşivler oluşturmuşlar ve bu portallarda Açık Erişim ve Açık Ders Arşivleri ile bugün için hizmet vermektedir. Örnek olarak; Gazi Üniversitesi’nin http://www.acikarsiv.gazi.edu.tr ve acikders.gazi.edu.tr adreslerinde, Ankara Üniversitesi’nin ise acikarsiv.ankara.edu.tr ve açık ders için acikders.ankara.edu.tr portallarından kamuya açık kaynak ve ders materyallerini sunduğu, diğer üniversitelerde de buna benzer açık arşiv portalları bulunmaktadır.
Ülkemizde bu alanda yapılan AB destekli projeler olduğu, açık erişim politikalarıyla ilgili olan MedOANet (Mediterranean Open Access Network), ortak altyapı oluşturmak için OpenAIREplus (Open Archives Infrastructure for Research in Europe) ve MedOANet'in devamı niteliğinde olan ve açık erişim politikalarının ve stratejilerinin geliştirilmesine katkı sağlamak amacıyla PASTEUR4OA (Open Access Policy Alignment Strategies for European Union Research) ile ülke bilgi birikimine katkılar sağlanmıştır.
Ülkemizde 2012 yılında Açık Yönetim Ortaklığı Girişimini (Open Government Partnership) destekleyen ülkelerden birisi olduğunu belirtmiş ve 23 Ağustos 2013’te 352013/9 sayılı ve “Açık Yönetim Ortaklığı Girişimi” konulu Başbakanlık Genelgesi (http://www.resmigazete.gov.tr/eskiler/ 2013/08/20130823-8.htm) yayımlayarak buna taraf olduğunu ve kurumların bu konuda gereğini yapmasını bildirmiştir. Gelinen noktaya bakıldığında ise ülkemizde yeni yeni kurumların bu konuya ağırlık verdikleri ve gerekli adımları, 2016-2019 Ulusal e-Devlet Stratejisi ve Eylem Planı gereği yerine getirmeye çalıştıkları bilinmektedir. Strateji dokümanında, 22 yerde “Açık veri” 24 yerde ise “Büyük veri” kelimesi geçmektedir. Eylem planında Hedef 4.2’de “Açık Verinin Kullanım Alanları Yaygınlaştırma” başlığı altında;
Ülkemizde açık veri konusunda kamu kurum / kuruluşlarının yanında özel sektör, sivil toplum kuruluşları gibi diğer paydaşları da içine alacak şekilde yapılacak çalışmaların çerçevesinin çizilmesi, kriterlerin belirlenmesi ve kullanımının yaygınlaştırılması,
Açık veri anonimleştirilmiş kamu verisi, özel sektör, üniversiteler, sivil toplum kuruluşları gibi tüm paydaşların verileri de açık veri olarak belirlenip burada tüm paydaşların dahil edildiği,
Paydaşlar tarafından üretilen verilerin açık veri olarak paylaşıldığı ve
Katma değer sağlanan bir modelin oluşturulması gerektiği vurgulanmıştır. Ayrıca, açık veri konusunda gerekli mevzuat düzenlemelerinin yapılarak açık verinin üretilmesinin ve kullanımının önündeki engellerin kaldırılmasına ihtiyaç duyulduğu, açık veri ortamlarının ve platformlarının oluşturulması görevinin ise Başbakanlığa verildiği, ve eylem maddelerinin ise E4.2.1: Açık Veri Paylaşım Portalının Oluşturulması ve E4.2.2 : Kamu Verilerinin Açık Veriye Dönüştürülmesi ve Paylaşılması olduğu strateji dokümanında belirtilmektedir.
TÜBİTAK ULAKBİM’in geliştirdiği DergiPark Projesi son dönemde en önemli projelerden birisidir. Bu açık dergi platformunda bugün için Türkçe ve İngilizce 1.446 dergi, 239.675 makale, 133.050 kullanıcının kaydı vardır. Bu platform, daha çok ülkemizde üretilen makalelerin açık olarak yayımlandığı bir projedir. Gazi Üniversitesi’nde ilk örneği yapılan bu projenin bugün için ülkeye yayılması ve 2013 yılından ULAKBİM altında toplanarak bu hizmetin bilimsel dergilere ücretsiz olarak sunulması ve bunu tüm akademisyenlere açmak çok önemli bir projedir. Bunun etkileri gelecekte daha net olarak görülecektir. Bunun konferanslar, seminerler ve çalıştaylar için de geliştirilmesi çok faydalı olacaktır. Ülkede üretilen bilimi, bu platform üzerinden sunmak ve gelecekte bu verileri farklı amaçlar için analiz etmek, ona göre planlamalar yapmak, yapılan çalışmaların etkisini görmek kolaylaşacaktır.
Bilgi Güvenliği Derneğinin her yıl Gazi Üniversitesi, ODTÜ ve İTÜ ile düzenlediği Uluslararası Bilgi Güvenliği ve Kriptoloji konferansında sunulan bildirilerin ve yapılan sunumların www.iscturkey.org adresinden tamamının ücretsiz yayımlanması ise bir diğer güzel örnektir. Bu tür örneklerin ve paylaşımların hızla artması, verilerin boyutlarının büyümesine ve toplanan verilerden yeni çıkarımların ve değerlerin elde edilmesini kolaylaştıracaktır.Bir sonraki yazımda, bu konudaki önerilerim, yapılabilecekler, elde edilebilecek kazanımlar ve alınması gereken önlemlere ilişkin görüşlerimi bulabilirsiniz.
*Gazi Üniversitesi, MF Bilgisayar Mühendisliği Bölüm Başkanı