Survival Analizi 101: Kaplan-Meier, Cox Regresyon ve "Tedavi Etkili mi?" Sorusunun İstatistikle Cevabı
PhD
Survival (Sağkalım) Analizi Nedir?
Klinik araştırmalarda araştırmacılar genellikle sadece "Tedavi edilen hasta iyileşti mi?" veya "Vefat etti mi?" sorularıyla ilgilenmezler. En az bunlar kadar kritik olan diğer soru şudur: "Bu olay ne kadar süre sonra gerçekleşti?". İşte belirli bir olayın (ölüm, hastalığın nüksetmesi, cihazın bozulması vb.) gerçekleşmesine kadar geçen süreyi inceleyen istatistiksel yöntemlere Survival (Sağkalım) Analizi denir.
Sansürlü Veri (Censored Data) Kavramı
Survival analizini klasik istatistikten (örneğin T-testi veya doğrusal regresyon) ayıran en büyük fark sansürlü verilerle başa çıkabilmesidir. Araştırma süresi boyunca şu durumlarla karşılaşabilirsiniz:
- Hasta araştırmadan kendi isteğiyle ayrılabilir.
- Hasta başka bir sebeple (örneğin trafik kazası) vefat edebilir.
- Araştırma süresi (örneğin 5 yıl) bittiğinde hasta hala hayatta olabilir.
Bu durumlarda olayın ne zaman gerçekleşeceğini kesin olarak bilemeyiz, sadece o ana kadar olay olmadığını biliriz. İstatistiksel olarak bu durum sağdan sansürlü (right-censored) veri olarak adlandırılır ve veriyi çöpe atmadan analize dahil etmenin tek yolu survival analizidir.
Kaplan-Meier Eğrisi ve Log-Rank Testi
Sağkalım analizi yaparken başvurulan ilk yöntem Kaplan-Meier Sağkalım Eğrisi'dir. Bu analiz, olayın (örneğin ölüm) zamana bağlı olarak gerçekleşme olasılığını görselleştirir. Eğri, her bir olayın gerçekleştiği zaman noktasında aşağı doğru bir basamak oluşturur.
İki farklı grubu (örneğin İlaç A alanlar vs. İlaç B alanlar) karşılaştırmak istediğimizde ise Log-Rank Testi devreye girer. Log-rank testi, bu iki grubun sağkalım eğrileri arasında istatistiksel olarak anlamlı bir fark olup olmadığını (p < 0.05) gösterir.
Cox Orantılı Riskler Regresyonu (Cox Proportional Hazards)
Kaplan-Meier sadece kategorik bir değişkenin (tedavi türü, cinsiyet vb.) etkisine bakabilir. Eğer hastanın yaşı, tansiyonu, kan değerleri gibi çok sayıda sürekli ve kategorik değişkenin sağkalım süresi üzerindeki etkisini aynı anda modellemek istiyorsak Cox Regresyonu kullanırız.
Cox modelinin en önemli çıktısı Tehlike Oranıdır (Hazard Ratio - HR):
- HR = 1: Değişkenin riske etkisi yoktur.
- HR > 1: Değişken, olayın gerçekleşme (tehlike) riskini artırır. (Örn: Sigara içenlerde ölüm riskinin HR=2.5 olması, sigara içmeyenlere göre 2.5 kat daha fazla riske sahip olduklarını gösterir).
- HR < 1: Değişken koruyucudur, riski azaltır. (Örn: Yeni ilacın HR=0.6 olması, ölüm riskini %40 oranında azalttığını ifade eder).
Kaynakça:
Bland, J. M., & Altman, D. G. (1998). Survival probabilities (the Kaplan-Meier method). BMJ, 317(7172), 1572.
Cox, D. R. (1972). Regression models and life-tables. Journal of the Royal Statistical Society: Series B (Methodological), 34(2), 187-202.
Hosmer Jr, D. W., Lemeshow, S., & May, S. (2011). Applied survival analysis: regression modeling of time-to-event data. John Wiley & Sons.