Survival Analizi 101: Kaplan-Meier, Cox Regresyon ve "Tedavi Etkili mi?" Sorusunun İstatistikle Cevabı
PhD
Survival (Sağkalım) Analizi Nedir?
Klinik araştırmalarda araştırmacılar genellikle sadece "Tedavi edilen hasta iyileşti mi?" veya "Vefat etti mi?" sorularıyla ilgilenmezler. En az bunlar kadar kritik olan diğer soru şudur: "Bu olay ne kadar süre sonra gerçekleşti?". İşte belirli bir olayın (ölüm, hastalığın nüksetmesi, cihazın bozulması vb.) gerçekleşmesine kadar geçen süreyi inceleyen istatistiksel yöntemlere Survival (Sağkalım) Analizi denir.
Sansürlü Veri (Censored Data) Kavramı
Survival analizini klasik istatistikten (örneğin T-testi veya doğrusal regresyon) ayıran en büyük fark sansürlü verilerle başa çıkabilmesidir. Araştırma süresi boyunca şu durumlarla karşılaşabilirsiniz:
- Hasta araştırmadan kendi isteğiyle ayrılabilir.
- Hasta başka bir sebeple (örneğin trafik kazası) vefat edebilir.
- Araştırma süresi (örneğin 5 yıl) bittiğinde hasta hala hayatta olabilir.
Bu durumlarda olayın ne zaman gerçekleşeceğini kesin olarak bilemeyiz, sadece o ana kadar olay olmadığını biliriz. İstatistiksel olarak bu durum sağdan sansürlü (right-censored) veri olarak adlandırılır ve veriyi çöpe atmadan analize dahil etmenin tek yolu survival analizidir.
Kaplan-Meier Eğrisi ve Log-Rank Testi
Sağkalım analizi yaparken başvurulan ilk yöntem Kaplan-Meier Sağkalım Eğrisi'dir. Bu analiz, olayın (örneğin ölüm) zamana bağlı olarak gerçekleşme olasılığını görselleştirir. Eğri, her bir olayın gerçekleştiği zaman noktasında aşağı doğru bir basamak oluşturur.
İki farklı grubu (örneğin İlaç A alanlar vs. İlaç B alanlar) karşılaştırmak istediğimizde ise Log-Rank Testi devreye girer. Log-rank testi, bu iki grubun sağkalım eğrileri arasında istatistiksel olarak anlamlı bir fark olup olmadığını (p < 0.05) gösterir.
Cox Orantılı Riskler Regresyonu (Cox Proportional Hazards)
Kaplan-Meier sadece kategorik bir değişkenin (tedavi türü, cinsiyet vb.) etkisine bakabilir. Eğer hastanın yaşı, tansiyonu, kan değerleri gibi çok sayıda sürekli ve kategorik değişkenin sağkalım süresi üzerindeki etkisini aynı anda modellemek istiyorsak Cox Regresyonu kullanırız.
Cox modelinin en önemli çıktısı Tehlike Oranıdır (Hazard Ratio - HR):
- HR = 1: Değişkenin riske etkisi yoktur.
- HR > 1: Değişken, olayın gerçekleşme (tehlike) riskini artırır. (Örn: Sigara içenlerde ölüm riskinin HR=2.5 olması, sigara içmeyenlere göre 2.5 kat daha fazla riske sahip olduklarını gösterir).
- HR < 1: Değişken koruyucudur, riski azaltır. (Örn: Yeni ilacın HR=0.6 olması, ölüm riskini %40 oranında azalttığını ifade eder).
SPSS'te Kaplan-Meier Analizi: Adım Adım
SPSS'te Kaplan-Meier analizi şu yolu izleyerek yapılır: Analyze → Survival → Kaplan-Meier. Time kutusuna süre değişkeninizi, Status kutusuna olay (örneğin ölüm = 1, sansürlü = 0) değişkeninizi girin. Define Event'te olay kodunu (1) belirleyin. Gruplar arasında karşılaştırma yapmak istiyorsanız Factor kutusuna grup değişkeninizi ekleyin ve Compare Factor kısmında Log-rank, Breslow veya Tarone-Ware testlerinden birini seçin. Sosyal bilimler ve klinik araştırmalarda Log-rank en yaygın kullanılan testtir.
Cox Regresyonu Varsayımları
Cox modelinin en temel varsayımı Orantılı Riskler (Proportional Hazards) varsayımıdır: her bağımsız değişkenin risk üzerindeki etkisinin zaman içinde sabit kalması gerekir. Bu varsayımı test etmek için Schoenfeld artıklarını zaman üzerine çizin; süre ile anlamlı korelasyon olmaması varsayımın karşılandığını gösterir. SPSS'te bu testi doğrudan üretmek mümkün değildir; R'ın survival paketindeki cox.zph() fonksiyonu bu iş için standarttır. Varsayım ihlal edildiğinde zaman-bağımlı kovariyatlar (time-dependent covariates) veya tabakalama (stratification) ile model düzeltilir.
Hazard Ratio'yu Tezde Raporlamak
Cox regresyon çıktısında Exp(B) sütunu Hazard Ratio (HR), 95% CI sütunu güven aralığını verir. APA formatında raporlama örneği: "İleri yaş, ölüm riskini anlamlı biçimde artırmaktadır (HR = 1.08, %95 CI [1.04, 1.12], p < .001). Bu bulgu, her bir yıllık yaş artışının ölüm riskini %8 oranında yükselttiğini göstermektedir." HR < 1 olan değişkenler için "risk %X azaltmaktadır" ifadesi kullanılır.
Survival Analizinde Sık Yapılan Hatalar
- Sansürlü veriyi silmek: Gözlem süresince olayın gerçekleşmediği katılımcıları analiz dışı bırakmak, veri kaybına ve taraflı sonuçlara yol açar. Sansürlü veriler mutlaka modele dahil edilmelidir.
- Zaman sıfır noktasını yanlış tanımlamak: Süreyi "tedavi başlangıcı", "teşhis tarihi" veya "araştırmaya giriş" olarak tanımlamak arasındaki seçim sonuçları kökten değiştirebilir. Zaman sıfırı net ve gerekçeli biçimde tanımlanmalıdır.
- Küçük örneklemde Cox modeli: Cox regresyonunda değişken başına en az 10 olay gözlemi önerilir; "10 events per variable" kuralı çok değişkenli modellerde özellikle önemlidir.
Survival Analizinin Sağlık Dışındaki Kullanım Alanları
Survival analizi yalnızca tıbbi araştırmalarla sınırlı değildir; "zaman-içinde-olaya-kadar" yapısına sahip her araştırma sorusu bu yöntemi geçerli kılar. Sosyal bilimler ve yönetim çalışmalarında sık kullanılan örnekler:
- İşletme: Müşterilerin abonelikten çıkana kadar geçen süre (churn analysis); şirketlerin iflasa kadar yaşadıkları süre.
- Eğitim: Öğrencilerin okul terk etmesine kadar geçen süre; bursun öğrenci başarısına etkisi.
- Psikoloji: Terapi sonrası iyileşmenin kalıcılığı; depresif atağın nüksüne kadar geçen süre.
- Mühendislik: Bir sistemin arıza göstermesine kadar geçen süre (güvenilirlik analizi).
Bu çeşitlilik, survival analizinin sosyal bilimciler için de temel bir araç setine dâhil edilmesi gerektiğine işaret etmektedir. R'ın survival paketi ve Python'ın lifelines kütüphanesi bu analizleri sağlık dışı alanlarda da erişilebilir hale getirmektedir.
Sonuç: Zamanı Bir Değişken Olarak Modellemek
Survival analizi, "olayın gerçekleşip gerçekleşmediği" sorusunun ötesine geçerek "ne zaman gerçekleştiğini" inceleyen güçlü bir araç ailesidir. Kaplan-Meier eğrisi ile görselleştirme, Log-rank testi ile grup karşılaştırması ve Cox regresyonu ile çok değişkenli modelleme; bu üç yöntem birbirini tamamlayan bir analiz silsilesi oluşturur. Sağlıktan sosyal bilimlere, mühendislikten eğitim araştırmalarına uzanan geniş uygulama alanıyla survival analizi, zaman boyutunu dikkate alan her araştırmacının repertuarında yer alması gereken bir metodolojik araçtır.
Kaynakça:
Bland, J. M., & Altman, D. G. (1998). Survival probabilities (the Kaplan-Meier method). BMJ, 317(7172), 1572.
Cox, D. R. (1972). Regression models and life-tables. Journal of the Royal Statistical Society: Series B (Methodological), 34(2), 187-202.
Hosmer Jr, D. W., Lemeshow, S., & May, S. (2011). Applied survival analysis: regression modeling of time-to-event data. John Wiley & Sons.