Ki-Kare mi Lojistik Regresyon mu? İkisinin Farkı Ne?
PhD
Ki-Kare mi Lojistik Regresyon mu? İkisinin Farkı Ne?
Kategorik verilerle (örneğin "Evet/Hayır", "Kadın/Erkek", "Hasta/Sağlıklı") çalışırken araştırmacıların en çok kararsız kaldığı iki analiz yöntemi Ki-Kare (Chi-Square) Testi ve Lojistik Regresyon modelidir. İki analiz de bağımlı değişkenin kategorik olduğu durumlarda çalışır. Ancak araştırma sorunuz sadece bir "ilişkiyi" mi arıyor, yoksa karmaşık bir "tahmin modeli" mi kurmak istiyor; işte testin kaderini bu ayrım belirler.
Kısa Tanım: Kavramsal Çerçeve
Ki-Kare Bağımsızlık Testi: İki kategorik değişken arasında anlamlı bir ilişki olup olmadığını test eder. Sadece "A ile B arasında bağlantı var mı?" sorusuna yanıt verir, etkinin boyutunu veya çoklu değişkenlerin etkisini modelleyemez.
Lojistik Regresyon: İki sonuçlu kategorik bir bağımlı değişkeni, bir veya daha fazla bağımsız değişken kullanarak tahmin etmeye yarar. Hangi değişkenin olasılığı (Odds Ratio) kaç kat artırdığını gösterir.
Ne Zaman Kullanılır?
Elinizde sadece iki adet kategorik soru varsa ve bunların birbiriyle bağlantılı olup olmadığını çapraz tablolarla görmek istiyorsanız Ki-Kare testi yeterlidir. Fakat bir bağımlı değişkeni birden fazla bağımsız değişkenle (sürekli veya kategorik) tahmin eden bir model kurmak istiyorsanız Lojistik Regresyon şarttır.
Örnek Senaryo Karşılaştırması
| Araştırma Amacı | Analiz Yöntemi | Elde Edilecek Sonuç |
|---|---|---|
| Cinsiyet ile kulüp üyeliği arasında ilişki var mıdır? | Ki-Kare Testi | İlişki var/yok (p değeri) |
| Cinsiyet, yaş ve GPA birlikte kulübe üye olmayı yordamakta mıdır? | Lojistik Regresyon | GPA'nın her 1 birimlik artışı üyelik olasılığını 1.4 kat artırır (OR) |
Tezde Nasıl Yazılır (APA Formatı)
Ki-Kare: "Katılımcıların cinsiyetleri ile sigara kullanma durumları arasında istatistiksel olarak anlamlı bir ilişki bulunmuştur, χ²(1, N=200) = 5.42, p = .020."
Lojistik Regresyon: "Yaş, cinsiyet ve stres düzeyinin kalp krizi geçirme durumunu yordama gücünü incelemek amacıyla Lojistik Regresyon analizi uygulanmıştır. Model istatistiksel olarak anlamlı bulunmuş (χ²(3) = 24.12, p < .001) ve artan yaşın kalp krizi geçirme olasılığını 1.15 kat artırdığı (OR = 1.15, %95 CI [1.02, 1.30], p = .012) tespit edilmiştir."
Kategorik veri analizlerinizi hemen yapmak için → Analizus Ki-Kare Testi aracını kullanın.
Ki-Kare İçin Beklenen Hücre Sayısı Varsayımı
Ki-kare testini uygulamadan önce bir varsayımı kontrol etmeniz zorunludur: çapraz tablodaki beklenen hücre sayılarının (expected counts) %80'i veya daha fazlası ≥ 5 olmalıdır. SPSS çıktısında "a cells have expected count less than 5" uyarısı görünüyorsa ki-kare sonuçları güvenilmez olabilir.
Bu durumda yapılabilecekler: (1) Kategorileri birleştirerek hücre sayılarını artırın. (2) 2×2 tablolarda Fisher'ın Kesin Testi (Fisher's Exact Test)'ne geçin — SPSS ki-kare çıktısında bu testi otomatik gösterir. (3) Monte Carlo simülasyonu ile olasılık hesaplaması yapın (SPSS'te Exact sekmesinden).
Fisher'ın Kesin Testi Ne Zaman Kullanılır?
Fisher's Exact Test, hücre sayılarının küçük olduğu 2×2 tablolarda ki-kare yerine tercih edilir. Ki-karenin asimptotik yaklaşımı küçük örneklemlerde güvenilmezken Fisher testi tam olasılık hesabı yapar. SPSS çıktısında otomatik görünür; raporlama: "Küçük hücre frekansları nedeniyle ki-kare testi yerine Fisher'ın Kesin Testi uygulanmış ve iki değişken arasında anlamlı ilişki bulunmuştur (p = .032)."
Lojistik Regresyon SPSS'te Adım Adım
Analyze → Regression → Binary Logistic yolunu izleyin. İkili bağımlı değişkeninizi (0/1) Dependent kutusuna, bağımsız değişkenleri Covariates kutusuna girin. Method olarak Enter (zorunlu giriş) veya Forward: LR (adımsal) seçin. Options kısmında Classification plots, Hosmer-Lemeshow goodness-of-fit ve CI for exp(B) seçeneklerini işaretleyin.
Etki Büyüklükleri: Ki-Kare ve Lojistik Regresyon
| Analiz | Etki Büyüklüğü | Küçük | Orta | Büyük |
|---|---|---|---|---|
| Ki-Kare | Cramer's V | .10 | .30 | .50 |
| Lojistik Regresyon | Nagelkerke R² | .10 | .30 | .50 |
SPSS ki-kare çıktısında Cramer's V ve Phi değerleri Symmetric Measures tablosunda görünür. Nagelkerke R² ise lojistik regresyon çıktısındaki Model Summary tablosunda yer alır.
Sık Yapılan Hatalar
- Ki-kare ile nedensellik kurmak: Ki-kare yalnızca ilişkiyi (association) gösterir; nedenselliği (causation) kanıtlamaz. "A değişkeni B'ye yol açar" ifadesi yerine "A ile B arasında anlamlı ilişki bulunmuştur" ifadesini kullanın.
- Çoklu lojistik regresyonu ihmal etmek: Birden fazla bağımsız değişken varsa basit ki-kare yerine lojistik regresyon, her değişkenin bağımsız katkısını kontrol ederek analiz eder.
- Odds Ratio'yu Risk Ratio gibi yorumlamak: OR ve RR farklı kavramlardır; düşük prevalanslı olaylarda yakın sonuç verse de, yüksek prevalanslı olaylarda büyük fark yaratır.
Çok Kategorili Bağımlı Değişken: Multinomial Lojistik Regresyon
Bağımlı değişkeniniz ikiden fazla kategoriye sahipse (örneğin "Düşük / Orta / Yüksek" veya "A / B / C / D") ikili lojistik regresyon yetersiz kalır. Bu durumda Multinomial Lojistik Regresyon kullanılır. SPSS'te: Analyze → Regression → Multinomial Logistic. Model, her kategoriyi referans kategorisiyle karşılaştıran log-odds oranları üretir. Bağımlı değişken sıralı (ordinal) bir yapıya sahipse (örneğin "Düşük < Orta < Yüksek") Ordinal Lojistik Regresyon daha uygun bir seçimdir; bu analiz orantılı oranlar (proportional odds) varsayımı gerektirir ve SPSS'te Analyze → Regression → Ordinal yoluyla erişilir.
Sonuç: Araştırma Sorusu Analizi Belirler
Ki-kare ve lojistik regresyon, kategorik veri analizinin iki temel aracıdır; ancak birbirinin alternatifi değil, tamamlayıcısıdır. "İki kategorik değişken ilişkili mi?" sorusu ki-kareyi, "hangi faktörler bir sonucu öngörür?" sorusu lojistik regresyonu işaret eder. Araştırma sorunuzu analiz yöntemine değil, analiz yöntemini araştırma sorunuza uydurmak metodolojik açıdan doğru yaklaşımdır. Bu ayrımı tezin Yöntem bölümünde açıkça gerekçelendirmek, savunmada jüri güvenini pekiştirecektir.
Son not: Ki-kare ve lojistik regresyon, kategorik bağımlı değişken analizinin birbirini tamamlayan iki aracıdır. Araştırma sorunuzun yalnızca ilişki mi, yoksa tahmin modeli mi gerektirdiğini belirleyerek doğru analizi seçin; bu seçimi tezin Yöntem bölümünde açıkça gerekçelendirin. Doğru seçim ve güçlü gerekçelendirme, savunmada metodolojik güveninizin temelini oluşturacaktır.
Kaynakça:
Hosmer, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied logistic regression. Wiley.
Agresti, A. (2018). An introduction to categorical data analysis (3rd ed.). Wiley.