Shapiro-Wilk p=0.049 Çıktı, Normal Dağılım Var mı Yok mu?
PhD
Shapiro-Wilk p=0.049 Çıktı, Normal Dağılım Var mı Yok mu?
Normallik testi yaptınız ve Shapiro-Wilk p değeri tam sınırda, 0.049 çıktı. 0.05'ten küçük olduğu için teknik olarak "normal dağılım yok" demek gerekiyor ama bu kadar yakın bir değerde gerçekten non-parametrik teste mi geçmek zorundasınız? Bu soru, istatistik danışmanlarının da sıklıkla tartıştığı nüanslı bir konudur.
Shapiro-Wilk Testinin Kısıtlaması: Büyük Örnekleme Duyarlılık
Shapiro-Wilk testinin kritik bir özelliği vardır: örneklem büyüdükçe çok küçük sapmalara bile anlamlı tepki verir. N = 200 olan bir örneklemde veriler neredeyse mükemmel normal dağılıyor olsa bile, çok ufak bir sapma nedeniyle p < 0.05 çıkabilir. Tersine, N = 20 olan küçük bir örneklemde veri çok çarpık olsa bile p > 0.05 çıkabilir çünkü test yetersiz güce sahiptir.
Bu nedenle Shapiro-Wilk testini tek başına karar verici olarak kullanmak doğru değildir.
p=0.049 Durumunda Kontrol Edilmesi Gereken 3 Ek Ölçüt
| Kontrol | Kabul Edilebilir Sınır | Ne Anlama Gelir? |
|---|---|---|
| Çarpıklık (Skewness) | -1.5 ile +1.5 arası | Bu sınırlar içindeyse normal dağılım varsayımı sürdürülebilir |
| Basıklık (Kurtosis) | -1.5 ile +1.5 arası | Uç değerlerin fazlalığı veya azlığı hakkında bilgi verir |
| Örneklem Büyüklüğü | N > 50 ise | Merkezi Limit Teoremi'ne göre dağılım normal kabul edilebilir |
Karar Algoritması
Shapiro-Wilk p = 0.049 çıktığında şu soruları sorun:
1. Örneklem büyüklüğünüz N > 100 mü? Evet ise bu p değeri büyük olasılıkla örneklem büyüklüğüne bağlı hassasiyetten kaynaklanıyordur. Çarpıklık ve basıklık değerlerine bakın.
2. Çarpıklık ve basıklık değerleri -1.5 ile +1.5 arasında mı? Evet ise parametrik teste devam edebilir ve tezinizde bunu gerekçelendirebilirsiniz.
3. Histogram ve Q-Q Plot'a baktınız mı? Grafiksel yöntemler, sayısal testlerin veremediği bütünsel resmi sunar. Eğri çan şeklini andırıyorsa ve Q-Q Plot çizgiye yakın seyrediyorsa normallik kabul edilebilir.
Tezde Nasıl Yazılır (APA Formatı)
"Verilerin normal dağılım gösterip göstermediğini incelemek amacıyla Shapiro-Wilk normallik testi uygulanmıştır. Test sonucunda p = .049 bulunmuş olmakla birlikte, çarpıklık değerinin (Skewness = 0.42, SE = 0.19) ve basıklık değerinin (Kurtosis = 0.87, SE = 0.38) kabul edilebilir sınırlar içinde (-1.5 ile +1.5) yer aldığı ve örneklem büyüklüğünün (N = 185) yeterli olduğu göz önüne alındığında, veri setinin normal dağılım varsayımını yeterince karşıladığı kabul edilmiş ve parametrik testler uygulanmıştır."
Verilerinizin normallik analizini yapmak için → Analizus Normallik Testi aracını kullanın.
p = .049 Ne Demektir?
Shapiro-Wilk testi H₀: "dağılım normal" hipotezini sınar. p = .049, eğer dağılım gerçekten normal olsaydı bu test istatistiğini veya daha aşırısını gözlemleme olasılığının %4.9 olduğu anlamına gelir. α = .05 eşiğinde H₀ reddedilir — teknik olarak "normallik yok" kararı verilir. Ancak bu karar pratik açıdan ne kadar anlamlı?
Örneklem Büyüklüğü Karar Değiştirir
Shapiro-Wilk testi örneklem büyüdükçe giderek hassaslaşır. n = 30'da tespit edemeyeceği bir sapmaları n = 200'de kolaylıkla anlamlı bulur. Bu yüzden p = .049 bulgusu örneklem büyüklüğüne göre çok farklı yorumlanır:
- n < 50: Test zaten düşük güçtedir, .049 gerçek sapmanın işareti olabilir — grafikleri inceleyin.
- n = 50–150: p = .049 borderline'dır; çarpıklık/basıklık değerleri ve Q-Q plot belirleyici olur.
- n > 150: p = .049 büyük ihtimalle pratikte önemsiz küçük bir sapma; parametrik testler sağlamdır.
Ne Yapılmalı: Karar Akışı
- Çarpıklık ve basıklık değerlerini kontrol edin: |çarpıklık| < 1 ve |basıklık| < 3 ise normal dışılık pratikte çok hafif demektir.
- Q-Q Plot'a bakın: Noktalar referans çizgisinden sistematik olarak sapıyor mu, yoksa uçlarda mı?
- Aykırı değer var mı? Boxplot ile kontrol edin; bir-iki aykırı değer tüm testi etkileyebilir.
- Örneklem boyutunuzu göz önünde bulundurun: n ≥ 30 ve sapma hafif ise Merkezi Limit Teoremi gereği parametrik testler geçerlidir.
- Her iki durumda da (parametrik kaldıysanız da, non-parametriğe geçtiyseniz de) kararınızı tezde gerekçelendirin.
Her İki Analizi Raporlamak
Belirsizlik yüksekse hem parametrik hem non-parametrik analizi çalıştırıp sonuçların tutarlılığını raporlayabilirsiniz: "Shapiro-Wilk testi sınır değerde anlamlılık göstermesi nedeniyle (p = .049) hem bağımsız örneklem t-testi hem de Mann-Whitney U testi uygulanmış; her iki analiz de benzer sonuçlar vermiştir (p < .01)." Bu yaklaşım bulgularınızın sağlamlığını pekiştirir.
Sonuç
p = .049, "normallik kesinlikle yok" veya "her şey yolunda" demek değildir. Grafiksel yöntemler, çarpıklık/basıklık istatistikleri ve örneklem büyüklüğü birlikte değerlendirildiğinde bu borderline değerin pratik önemi netleşir. İstatistiksel karar ile pratik karar her zaman örtüşmez; araştırmacı ikisi arasındaki bu ayrımı anlayıp tezinde açıklayan kişidir.
Özet: Sınır Değerde Karar
p = .049 borderline bir bulgudur ve tek başına net bir karar vermek için yeterli değildir. Doğru yaklaşım çok katmanlıdır: çarpıklık ve basıklık istatistikleri hafif sapma gösteriyorsa, Q-Q plot noktaları referans çizgisine yakınsa ve örneklem büyüklüğü n ≥ 30 ise parametrik testlere devam etmek Merkezi Limit Teoremi çerçevesinde savunulabilirdir. Buna karşın belirsizlik sürdüğünde hem parametrik hem non-parametrik analizi çalıştırıp sonuçların tutarlılığını raporlamak bulgularınıza ek güvenilirlik katar. Her durumda kararınızı ve gerekçenizi tezin yöntem bölümünde açıkça belirtmek metodolojik şeffaflığın ve akademik olgunluğun somut göstergesidir.
Son not: Normallik kararında çok kanallı düşünmek, tek bir p değerine kilitlenmekten her zaman daha sağlıklı ve savunulabilir bir yaklaşımdır. Tez jürisi "neden parametrik test kullandınız?" diye sorduğunda verilere dayalı çok adımlı gerekçeniz en güçlü yanıtınız olacaktır.
Kaynakça:
Field, A. (2018). Discovering statistics using IBM SPSS statistics (5th ed.). Sage.
Kim, H. Y. (2013). Statistical notes for clinical researchers: Assessing normal distribution. Restorative Dentistry & Endodontics, 38(1), 52–54.