Aperta Projesi: Türkiye’de açık verinin depolanması ve paylaşılması için yapılan çalışmalar
Dünyada akademik araştırmaların en fazla kabul gören çıktıları bilimsel makalelerdir. Bu makaleler birden fazla bilim insanı tarafından yazılmakta, aynı şekilde birden fazla bilim insanı tarafından irdelenmekte ve bu süzgeçlerden geçtikten sonra yayınlanmaktadırlar.
Bu makaleler daha sonraki araştırmalara, makalelere, patentlere ve ürünlere temel oluştururlar. Bu şekilde bilimsel araştırma ve gelişim döngüsü devam etmektedir. Bununla beraber, makaleler sadece buz dağının görünen kısmını oluşturmaktadır. Makaleler bilgi, emek ve en önemlisi makaleyi oluşturma süresince toplanan ya da üretilen veriden oluşmaktadır.
Son yıllarda, bugüne kadar görünmez olan, veri de aynı şekilde önemsenmeye başlanmıştır. Makaleleri oluşturan veri de aynı şekilde incelenmekte, doğruluğu sorgulanmakta ve diğer araştırmalarda kullanılmak üzere talep görmektedir.
Veri ve açık verinin araştırmalardaki önemi
Verinin son zamanlarda bu kadar önemli hale gelmesinin sebepleri çeşitlidir. Bunlardan ilki toplanan veri boyutunun büyümesidir. Araştırmalar ilerledikçe ve karmaşıklaştıkça, daha doğru sonuçlara ulaşabilmek daha fazla veri gerektirir hale gelmiştir. Aynı şekilde, gelişen teknoloji de daha fazla verinin toplanmasını ve işlenmesini mümkün hale getirmiştir. Teknolojinin son zamanlardaki gelişimi, Amazon ve Google gibi devlerin bulut bilişime yapmış olduğu yatırımlar ile gerekli hesaplama ve depolama kapasitesine erişimi kolaylaştırmış ve ilgili maliyetleri oldukça düşürmüştür. Bu faktörler birleştiğinde daha fazla verinin toplanması, depolanması ve işlenmesi için kusursuz fırtına denilebilecek bir dinamik ortaya çıkmaktadır.
Bununla beraber, toplanan verinin artması ve daha derinlemesine işlenebilmesi, aynı veriden daha fazla bilgi üretilebilmesini mümkün kılmaktadır. Bu durum verinin tek kullanımlık bir yığın olmaktan çıkmasına ve birden fazla araştırmada, birden fazla şekilde ve birden çok disiplinde kullanılabilmesinin önünü açmıştır. Bu yeniden kullanım hem araştırma maliyetini düşürmekte, hem de araştırmacılar arası işbirliğinin kolaylaşmasını ve hızlanmasını sağlamaktadır.
Bütün bu gelişmelerin sonucunda; veri, araştırmaların incelenmesi sırasında ve daha sonrasında diğer araştırmalarda da kullanılabilmek için talep edilen bir meta haline dönüşmüştür. Verinin, araştırmanın aksine, görece ham olması ve yayına hazırlanmamış olması; saklanması ve paylaşılmasını zorlaştırmaktadır. Verinin açık olarak ve sınırsızca paylaşılması her zaman mümkün olmasa da, bu şekilde paylaşılan veri miktarı her geçen gün artmaktadır.
Dünya genelinde verinin açıkça paylaşılabilmesi, incelenebilmesi ve alıntılanabilmesi için belirli platformlar geliştirilmeye ve kullanılmaya başlanmıştır. Bu platformlara araştırma verisi yönetimi (Research Data Management – RDM) yazılımları denmektedir. Dünya genelinde bu tip yazılımlar hızla geliştirilmekte ve ülkeler tabir yerinde ise en gelişkin ve popüler platforma sahip olmak için birbirleri ile yarışmaktadırlar.
Türkiye’deki açık veri çalışmaları: Aperta ve Araştırma Verileri Yönetimi Eğitim Portalı
Türkiye de bu dönüşüm ve değişim sürecinde yerini alabilmek ve sağlamlaştırabilmek için kendine ait bir araştırma verileri yönetimi platformu ve bir bilgilendirme portalı geliştirmektedir. Aperta (Latince’de Açık, Görünür anlamında) adındaki bu araştırma verileri yönetimi platformu, Türkiye’deki açık bilim için en büyük veri depolarından biri olma gayesi taşımaktadır.
Aperta, dünyadaki en gelişmiş platformlardan biri olan ve CERN tarafından geliştirilen Zenodo platformundan evrildi. Zenodo’nun ve türevlerinin popülaritesinden dolayı, platformun bir sonraki sürümü CERN, TÜBİTAK ULAKBİM, Caltech, Northwestern University, Uni Bonn gibi büyük ortakların oluşturduğu bir konsorsiyum tarafından geliştiriliyor. Bu platform makale, metin, video, ses, veri arşivleri gibi birçok türdeki kaydı depolayabiliyor, aranır ve alıntılanabilir hale getiriyor. Sağladığı topluluklar desteği ile konu veya araştırma ekiplerine özel koleksiyonların oluşturulmasına ve aranmasına izin veriyor.
Yazılım açık kaynaklı olarak ve son derece özgürlükçü bir lisans ile geliştiriliyor. Bu sayede rahatça uyarlanabilmesi ve yaygınlaşabilmesi hedefleniyor. Yazılım açık veri öncelikli ve odaklı olsa da diğer erişim türlerine de (sınırlı, ambargolu) destek veriyor. Aperta’da ilk başta TÜBİTAK projelerinden üretilen yayınların depolanması planlansa da Aperta’nın asıl hedefi kullanıcıların araştırmaları sırasında ürettikleri ve/veya kullandıkları verileri depolamak ve paylaşmak.
Açık verinin yaygınlaşması sadece verinin paylaşımı için ilgili platformların geliştirilmesi ile mümkün değil. Araştırmacıların ve konu ile ilgili kişilerin verinin hazırlanması, paylaşılması ve uygun şekilde lisanslanabilmesi için doğru bilgiye erişmesi ve konu hakkında farkındalığı son derece önemlidir. Bu nedenlerden dolayı açık veri konusunun doğru anlaşılabilmesi ve araştırmacıların bilinçlendirilebilmesi için TÜBİTAK ULAKBİM’in geliştirdiği bir Araştırma Verileri Yönetimi Eğitim Portalı, Aperta’ya eşlik ediyor. acikveri.ulakbim.gov.tr adresinden ulaşılabilen bu portal; araştırma verisi, açık veri, açık bilim ve bu üçgenin içerisinde kalan bütün konular hakkında gerekli cevapları vermeyi ve araştırmacıları verilerinin hazırlanması ve ileriki araştırmalar için kullanılabilir hale gelmesi konusunda eğitmeyi hedefliyor. Araştırmacılar son derece detaylı şekilde hazırlanmış bu portaldan ilgili soruları alabilecekleri gibi belirtilen kategoriler ve birbirine bağlı konular hakkında bilgi alabiliyorlar.
Sonuç olarak Türkiye, dünyada büyük bir hıza ulaşmış olan araştırma verilerinin açık hale getirilmesi, paylaşılması ve doğru şekilde yeniden kullanılabilmesi ile ilgili değişime seyirci kalmayarak, kendi yerini sağlamlaştırmak ve konudaki lider ülkelerden biri olmak için konuyu yakından takip edip gerekli adımları atıyor.