Analizus ile Veri Kazıma: YÖK Tez, TR Dizin ve OpenAlex'ten Literatür Toplama
PhD
Literatür Taramasında Veri Kazıma (Scraping) Nedir?
Tez veya makale yazarken araştırmacıların en çok vaktini ve enerjisini alan aşama şüphesiz literatür taramasıdır. Belirli bir konuda yazılmış yüzlerce makaleyi veya tezi tek tek aramak, başlıklarını kopyalamak, özetlerini okumak ve bu verileri bir Excel dosyasına elle işlemek haftalar hatta aylar sürebilir. Veri kazıma (web scraping) teknolojileri sayesinde bu manuel süreci dakikalara indirmek mümkündür. Analizus.com, araştırmacılar için özel olarak geliştirdiği araçlarla Türkiye'nin ve dünyanın en büyük akademik veri tabanlarından otomatik ve sistematik veri çekilmesini sağlar.
YÖK Tez Kazıma Aracı →
Türkiye'de yazılmış lisansüstü tezlerin tek resmi kaynağı olan YÖK Ulusal Tez Merkezi, çok zengin bir bilimsel havuzdur. Bibliyometrik analizler yapmak veya spesifik bir alandaki trendleri görmek isteyenler için buradaki veriler çok kıymetlidir. Ancak sistem, toplu veri indirmeye izin vermez. Analizus'un YÖK Tez Kazıma aracı ile bu engeli aşabilirsiniz:
- Belirlediğiniz anahtar kelimelere göre binlerce tezin künyesini (Yazar, Danışman, Yıl, Üniversite, Enstitü, Konu, Tür vb.) tek bir tıklamayla sistemden çekebilirsiniz.
- Tez özetlerini (Abstract) Türkçe ve İngilizce dillerinde toplu halde elde edebilirsiniz.
- Elde ettiğiniz bu geniş veri setini saniyeler içinde
.xlsxveya.csvformatında dışa aktararak SPSS veya R gibi analiz programlarına doğrudan yükleyebilirsiniz.
YÖK Tez Kazıma Aracını Kullan →
TR Dizin Veri Çekme Aracı →
TÜBİTAK ULAKBİM tarafından yönetilen TR Dizin, Türkiye merkezli ulusal hakemli dergilerin en önemli indeksidir. Doçentlik başvuruları ve yerel literatür analizi için kritik olan TR Dizin'den veri toplamak bazen hantal bir sürece dönüşebilir. Analizus'un TR Dizin modülü sayesinde:
- Ulusal dergilerdeki makalelerin başlık, özet, yazar, bağlı olunan kurum ve dergi bilgilerini kolayca listeleyip çekebilirsiniz.
- Belirli bir araştırma konusunun Türkiye'de yıllara göre nasıl bir gelişim gösterdiğini analiz etmek (trend ve frekans analizleri) için ham verinizi hatasız bir şekilde hızla oluşturabilirsiniz.
TR Dizin Kazıma Aracını Kullan →
OpenAlex ile Global Literatür Analizi →
250 milyondan fazla akademik eseri barındıran ve tamamen açık kaynaklı devasa bir bibliyografik veri tabanı olan OpenAlex, günümüzde Web of Science (WoS) ve Scopus'un en büyük ücretsiz alternatifidir. Analizus'un OpenAlex entegrasyonu size küresel literatürün kapılarını açar:
- Uluslararası makale, kitap, preprint ve konferans bildirilerinin meta verilerini gelişmiş filtrelerle (yıl, ülke, yazar, dergi) çekebilirsiniz.
- İlgili literatürdeki yazarların h-indeksi, kurumların genel yayın performansları ve kaynakların atıf verileri gibi kritik metrikleri süzebilirsiniz.
- VOSviewer veya CiteSpace gibi haritalama programlarına aktarmak üzere ağ analizi (network analysis) ve ortak yazar (co-authorship) çalışmaları için hazır ham veri setini saniyeler içinde indirebilirsiniz.
OpenAlex Kazıma Aracını Kullan →
Tezde Nasıl Yazılır (APA Formatı)
Bibliyometrik bir tez veya sistematik derleme (systematic review) makalesi yazıyorsanız, veriyi nasıl elde ettiğinizi metodoloji bölümünde şeffafça bildirmelisiniz.
"Bu araştırmanın veri seti, [Tarih] tarihinde Analizus veri kazıma (web scraping) araçları kullanılarak oluşturulmuştur. Belirlenen anahtar kelimeler çerçevesinde YÖK Ulusal Tez Merkezi ve OpenAlex veri tabanlarından ilgili eserlerin meta verileri (başlık, yazar, yıl, özet ve kurum bilgileri) otomatik olarak çekilmiş ve analiz programlarına aktarılmak üzere .csv formatında dışa aktarılmıştır."
Analizus Neden Veri Kazımıyor?
Analizus, TR Dizin ve OpenAlex gibi veri kaynaklarına web scraping (veri kazıma) ile değil, resmi API'ler ve veri paylaşım anlaşmaları aracılığıyla erişim sağlar. Bu tercih yalnızca teknik değil, etik ve hukuki bir karardır: veri kazıma platform hizmet koşullarını ihlal edebilir, kaynak veritabanının performansını olumsuz etkiler ve veri doğruluğu konusunda güvensizlik yaratır.
TR Dizin Verisi Nasıl Kullanılıyor?
TR Dizin, Türkiye'nin ulusal akademik atıf ve dizin veritabanıdır. Analizus'ta TR Dizin verisine erişim, TÜBİTAK ULAKBİM ile kurumsal işbirliği protokolü çerçevesinde yürütülür. Bu yapı şu avantajları sağlar:
- Verinin güvenilirlik ve güncelleme döngüsü kaynak kurumun kontrolündedir.
- Yazara ait meta veri (isim, kurum, ORCID) olabildiğince doğru yansıtılır.
- Olası yanlışlıklar Analizus'a değil, kaynağa atfedilerek düzeltilebilir.
OpenAlex: Açık Kaynak Bibliyometri
OpenAlex, Microsoft Academic Graph'ın kapanmasının ardından Our Research tarafından geliştirilen açık erişimli bir akademik veri kaynağıdır. 250 milyonun üzerinde çalışma, yazar ve kurum kaydı içeren bu kaynak tamamen açık erişimlidir ve kısıtlama olmaksızın API erişimi sunar. Analizus, uluslararası yayın ve atıf verilerini OpenAlex API üzerinden çeker; bu veri Türkiye'nin global akademik konumunu izlemek ve araştırmacıların uluslararası görünürlüğünü değerlendirmek için kullanılır.
Araştırmacı için Ne Anlam İfade Eder?
Analizus'ta görünen verinin kaynağı her zaman etiketlenir: TR Dizin mi, OpenAlex mı, kullanıcı tarafından girilen mi? Bu şeffaflık, araştırmacının elindeki sayının nereden geldiğini bilmesini ve buna göre yorumlamasını sağlar. Bir atıf sayısı düşük görünüyorsa kaynak, veri sağlayıcısının güncelliğiyle ilgili olabilir; bu bağlamda Analizus destek ekibine bildirim yapılabilir.
Tez İçin Analizus Verisi Kullanmak
Analizus'tan alınan istatistikler tezde kaynak olarak gösterilirken şu biçim önerilir: Analizus. (2026). [Araştırmacı/kurum adı] bibliyometrik analizi [veri seti]. https://analizus.com OpenAlex verisi için doğrudan kaynak göstermek istenirse: Priem, J., Piwowar, H., & Orr, R. (2022). OpenAlex: A fully-open index of the world's research output. arXiv. https://doi.org/10.48550/arXiv.2205.01833
Sonuç
Veri bütünlüğü, Analizus'un tasarım önceliğidir. Kazıma yerine resmi kanallar kullanmak kısa vadede ek operasyonel yük getirse de uzun vadede verinin doğruluğunu ve platformun güvenilirliğini garanti eder. Araştırmacılar bu veri altyapısından yararlanırken kaynağın her zaman TR Dizin veya OpenAlex gibi denetlenebilir bir noktaya izlenebileceğini bilmelidir.
Kaynakça:
Priem, J., Piwowar, H., & Orr, R. (2022). OpenAlex: A fully-open index of scholarly works, authors, venues, institutions, and concepts. arXiv preprint arXiv:2205.01205.
TÜBİTAK ULAKBİM. (2023). TR Dizin Veri Tabanı.
Yükseköğretim Kurulu (YÖK). Ulusal Tez Merkezi İstatistikleri.