Yapay Zeka Hangi Aşamada "Ekip Arkadaşı" Olabilir?
Literatür Taraması: Hala İnsan Kontrolünde
YZ araçları (Consensus, Elicit, SciSpace vb.), manuel aramalarla bulunan makalelerin tamamını yakalamakta başarısız oldu. En yüksek geri çağırma (recall) oranı sadece %18'de kaldı. YZ araçları genellikle ödeme duvarı arkasındaki makalelere erişemediği için kapsamlı bir tarama için henüz yeterli değil.
Tarama Aşaması: YZ’nin En Güçlü Olduğu Yer
Başlık ve özet taramasında ASReview ve SWIFT ActiveScreener gibi araçlar büyük başarı gösterdi:
Yüksek Hassasiyet: Manuel taramayla bulunan makalelerin %96 ila %97'sini başarıyla tespit ettiler.
İş Yükü Azaltma: "Aktif öğrenme" sayesinde en alakalı makaleleri en üste taşıyarak, araştırmacının okuması gereken makale sayısını ciddi oranda düşürdüler.
Veri Çıkarma ve Özet Tablo Oluşturma
ChatGPT ve SciSpace gibi araçlar temel bilgileri (yıl, yazar, ülke) çıkarmada başarılı olsa da , karmaşık klinik verilerde ve sonuç yorumlamada yanıldılar. Özellikle görsel veya tablo formatındaki verileri okumakta hala zorlanıyorlar.
Yanlılık Riski (Risk of Bias): Güvenilirlik Düşük
YZ araçları ile insan hakemler arasındaki uyum (inter-rater reliability) oldukça düşük çıktı. YZ araçları, klinik çalışmaların kalitesini değerlendirirken bağlamsal anlayıştan yoksun oldukları için bu aşamada henüz güvenilir değiller.
Araştırmacıların Yeni Stratejisi Ne Olmalı?
Çalışma, YZ'nin insanı tamamen değiştirmesi yerine, hibrit bir model öneriyor:
Birinci ve Üçüncü Hakem: Herhangi bir kısıtlama olmadan manuel taramaya devam etmeli.
İkinci Hakem: İş yükünü azaltmak için ASReview veya SWIFT ActiveScreener gibi araçları kullanarak sadece YZ'nin "alakalı" bulduğu kısımları tarayabilir.