Google’da arama yapmanın incelikleri
Son dönemde elektronik ortamların sağladığı kolaylıklar hayatımızın her noktasına girdi. İş süreçleri hızlanırken verimlilikler arttı ve her noktadan istediğimiz bilgiye ulaşabilir hale geldik. Web sayfaları sadece ziyaret amaçlı değil bir çok yazılımı mekandan bağımsız hale getirmek için bir yöntem olarak kullanılmasına da ön ayak oldu. Günümüzde web tabanlı yazılım mimarileri de oldukça fazla ilgili görüyor. Birileri için fayda ve avantaj sağlayan web ortamları kötü niyetli kişiler için de yeni fırsatları beraberinde getirdi.
Bilgisayar korsanları da elektronik ortamlara izinsiz erişim için yeni yöntemler geliştirme konusunda arama motorlarına yöneldi. Web tabanlı uygulamalara arama motorları sayesinde kolayca ulaşmak mümkün. Bu noktadan hareketle özellikle web tabanlı uygulamalara yönelik tehditleri ve bu uygulamalar üzerinde arama motorlarında dikkat edilmesi gerekenleri ortaya koymak amacıyla Gazi Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölümü Başkanı Prof. Dr. Şeref Sağıroğlu ve Uzman İbrahim Akşit bir çalışma hazırladı. Çalışmanın adı ise “Google’da Arama Yapmanın İncelikleri ve IPv6 Tabanlı Sistemlerde Arama”.
Google’da arama sadece kutudan ibaret değil
Arama motorları arasında Türkiye’de en fazla kullanılan Google olduğundan yola çıkan araştırmacılar çalışma hakkında şu noktaya dikkat çekiyor: “Bu çalışma, Google gibi işini doğru yapan, kullanıcılara web ortamında biriken verileri en iyi şekilde sunmaya çalışan arama motorlarını kötülemek değil, bu ortamları kullananların dikkat etmesi gereken hususları özetlemek ve kullanıcıları bilgilendirmek amacıyla hazırlanmıştır.”
Google’ı belki de en popüler arama motorlarından biri haline getiren özelliklerin başında gelişmiş arama yapabilmek için ileri seviyeli arama operatörlerinin kullanılabiliyor olması geliyor. Örneğin “stocks:xxx” araması yapıldığın stok bilgilerine ulaşmak mümkün.
Sağıroğlu ve Akşit’in çalışmasında benzer bilgilere ulaşmak için onlarca yöntemden söz etmek mümkün. (intitle, allintitle, inurl, allinurl, filetype, intext, allintext, site, link, inanchor, daterange, cache, info, related, phonebook, rphonebook, bphonebook, author, group, insubject, stocks, define gibi…) Tabii bu sorgulama yöntemleriyle kişisel ya da şirket, kurum bilgilerinizin de art niyetli kişilere açık olduğu anlamına geliyor.
Bu operatörleri kullanarak hangi bilgilere ulaşılabilir? (Çalışmadan bazı örnekler)
“filetype:sql “#mysql dump” (SQL tanımlama dosyaları için)
“ filetype:ora ora (Oracle Konfigurasyon dosyaları için)
“ filetype:mdb inurl:profiles (Access veritabaları profilleri)
“ filetype:reg reg +intext:”internet account manager” (Size kullanıcı adları, e-posta sunucu ayarları gibi bilgileri içeren kayıt dosyalarını bulmanızı sağlar.)
“ intitle:”index of” lck
(Çeşitli kilitli dosyalar)
“ Eğer Google üzerinden aranıp listelenen web sitelerinde olmak istemiyorsanız, Web sitenizi Google indeksinden kaldırmayı düşünebilirsiniz. Örn: http://www.google.com/remove.html
“ Oluşturduğumuz web sitelerin Meta Tag alanlarına robot, ve Google örümcekleri erişim kısıtlaması getirebilirsiniz.
“ Web siteleriniz için robot.txt dosyası oluşturup erişilmesini istemediğiniz dosya ve klasörleri kısıtlayabilirsiniz.