Normallik Testi Sonuçları Nasıl Yorumlanır? Shapiro-Wilk ve Kolmogorov-Smirnov Karşılaştırması
PhD
Normallik Testi Nedir ve Neden Önemlidir?
Nicel veri analizinde, özellikle Bağımsız Örneklem T-Testi veya ANOVA gibi parametrik testleri uygulamadan önce karşılamanız gereken en temel varsayım verilerin normal dağılıma sahip olmasıdır. Verilerinizin normal dağılıp dağılmadığını belirlemek için hipotez testleri olan normallik testlerine başvurulur. Bu testler, elinizdeki örneklem dağılımının ideal (teorik) bir normal dağılımdan anlamlı bir şekilde farklı olup olmadığını kontrol eder.
Shapiro-Wilk ve Kolmogorov-Smirnov: Hangisini Seçmeliyim?
Normallik sınaması söz konusu olduğunda en çok kullanılan iki istatistiksel test Shapiro-Wilk (S-W) ve Kolmogorov-Smirnov (K-S) testleridir. Bu iki testin seçimi genellikle örneklem büyüklüğüne (N) bağlıdır:
| Test Adı | Kullanım Durumu (Örneklem Büyüklüğü) | Özellikleri |
|---|---|---|
| Shapiro-Wilk | Genellikle N < 50 (Bazı kaynaklara göre N < 300) | Küçük örneklemlerde daha güçlü ve güvenilirdir. Verinin normal dağılımdan sapmalarına karşı hassastır. |
| Kolmogorov-Smirnov | Genellikle N ≥ 50 | Büyük örneklemlerde tercih edilir. Ancak, SPSS'te genellikle Lilliefors düzeltmesi ile birlikte kullanılır. |
Not: Modern istatistik literatüründe, Shapiro-Wilk testinin her iki durum için de daha tutarlı sonuçlar verdiği sıkça vurgulanmaktadır.
SPSS'te Normallik Testi Nasıl Yapılır?
SPSS programında verilerinizin normal dağılıp dağılmadığını kontrol etmek için şu adımları izleyebilirsiniz:
- Üst menüden
Analyzesekmesine tıklayın. Descriptive Statisticsüzerine gelin veExplore...seçeneğine tıklayın.- Test etmek istediğiniz sürekli değişkeni (veya ölçek puanını)
Dependent Listkutusuna atın. - Eğer gruplar arası (örneğin cinsiyete göre) bir normallik incelemesi yapacaksanız, grup değişkeninizi
Factor Listkutusuna ekleyin. - Sağ taraftaki
Plots...butonuna tıklayın. - Açılan pencerede
Normality plots with testskutucuğunu işaretleyin. - Önce
Continue, ardındanOKbutonuna basarak analizi çalıştırın.
Test Sonuçları (p-değeri) Nasıl Yorumlanır?
SPSS çıktısındaki "Tests of Normality" tablosunda hem Kolmogorov-Smirnov hem de Shapiro-Wilk testlerinin sonuçları yer alır. Yorumlama yaparken Sig. (p-değeri) sütununa bakılır.
- p > 0.05 ise: Veriler normal dağılmaktadır (Normallik varsayımı sağlanmıştır). Testin temel hipotezi (H0: Veri normal dağılıma uyar) reddedilemez.
- p < 0.05 ise: Veriler normal dağılmamaktadır. Dağılımın normalden anlamlı derecede saptığı anlamına gelir.
Sadece Normallik Testleri Yeterli mi? Çarpıklık ve Basıklık Değerleri
Büyük örneklemlerde (örneğin N > 300), normallik testleri çok küçük sapmaları bile anlamlı bularak (p < 0.05) verinin normal dağılmadığını söyleyebilir. Bu nedenle normallik testleri tek başına yeterli görülmez. Mutlaka Çarpıklık (Skewness) ve Basıklık (Kurtosis) değerleri ile grafiksel yöntemler de incelenmelidir.
Genel kabul gören kurala göre, Çarpıklık ve Basıklık değerleri -1.5 ile +1.5 (bazı kaynaklara göre -2 ile +2) arasında ise verinin normal dağılıma sahip olduğu kabul edilebilir. Ek olarak, Q-Q Plot grafikleri ve Histogramlar da dağılımın görsel olarak yorumlanmasında en büyük yardımcılarınızdır.
Hangi Test, Ne Zaman?
Shapiro-Wilk ve Kolmogorov-Smirnov (K-S) testleri aynı soruyu farklı güç düzeyinde yanıtlar. Shapiro-Wilk, özellikle küçük ve orta örneklemlerde (n < 2000) daha güçlüdür ve tercih edilir. K-S testi ise büyük veri setlerinde kullanılabilir; ancak bu testlerin her ikisi de büyük örneklemlerde son derece hassaslaşır ve pratikte önemsiz sapmalar bile anlamlı çıkar.
Örneklem Büyüklüğünün Kritik Etkisi
n < 50 ise: Shapiro-Wilk'in düşük güç nedeniyle p > .05 vermesi sık görülür; gözden kaçan normallik sapmaları olabilir. n = 50–200 aralığında: Shapiro-Wilk güvenilir bir karar verir; p < .05 pratikte anlamlı sapma demektir. n > 200 ise: Her iki test de neredeyse her zaman p < .05 verir — bu durumda p değerini değil çarpıklık/basıklık istatistiklerini ve grafiksel yöntemleri esas alın.
Çarpıklık ve Basıklık Değerleri
Normallikten sapmanın şiddetini ölçmek için çarpıklık (skewness) ve basıklık (kurtosis) istatistiklerini standart hatayla karşılaştırın: |z| = değer/standart hata. |z| < 1.96 → hafif sapma (α = .05), |z| < 3.29 → orta sapma (α = .001). Alternatif olarak Kim (2013) kabul kriterlerini kullanabilirsiniz: |çarpıklık| < 2 ve |basıklık| < 7 büyük örneklemlerde kabul edilebilirdir.
Görsel Yöntemler: Q-Q Plot ve Histogram
Histogram uç değerleri ve genel şekli hızlıca gösterir. Normal Q-Q Plot ise normallik hakkında en bilgilendirici grafiksel araçtır: gözlem noktaları referans çizgisine yakınsa dağılım normale yakındır. Sistematik S-eğrisi yoğun çarpıklığı, referans çizgisinden sapan uç noktalar aykırı değerleri işaret eder. Tezin yöntem bölümüne bu grafiklerin yorumunu eklemeniz beklenir.
Normallik Sağlanmıyorsa Karar Süreci
Sapma tespit edildiğinde üç seçenek değerlendirilmelidir: (1) Merkezi Limit Teoremi — n ≥ 30 ve sapma hafif ise parametrik testler genellikle sağlamdır; (2) Dönüşüm — log, karekök veya Box-Cox dönüşümü deneyebilirsiniz, ancak yorum güçleşir; (3) Non-parametrik testler — Mann-Whitney U, Kruskal-Wallis veya Wilcoxon gibi dağılımdan bağımsız testlere geçin. Her durumda kararın gerekçesini tezde şeffaflıkla belirtmek metodolojik olgunluğun göstergesidir.
Özet: Doğru Karar için Üç Adım
Normallik testini yorumlarken tek bir p değerine güvenmek yerine üç adımlı bir süreç izleyin: (1) Shapiro-Wilk p değerini örneklem büyüklüğüyle birlikte okuyun — küçük n'lerde p > .05 normalliği garanti etmez; büyük n'lerde p < .05 küçük sapmayı işaret eder. (2) Çarpıklık ve basıklık değerlerini standart hatayla oranladığınızda |z| < 1.96 çıkıyorsa dağılım pratikte normale yeterince yakındır. (3) Q-Q plot'ta noktalar referans çizgisine yakınsa grafiksel kanıt sayısal testi destekler. Bu üç kanal uyumlu sonuç veriyorsa güvenle karar verebilirsiniz; tutarsızlık varsa non-parametrik alternatifleri değerlendirin ve kararınızın gerekçesini tez yöntem bölümünde belirtin. Normallik testi nihai hüküm değil, kılavuzdur.
Kaynakça:
Tabachnick, B. G., & Fidell, L. S. (2013). Using multivariate statistics (6th ed.). Pearson.
Field, A. (2018). Discovering statistics using IBM SPSS statistics (5th ed.). Sage.
George, D., & Mallery, P. (2019). IBM SPSS Statistics 26 Step by Step: A Simple Guide and Reference (16th ed.). Routledge.