p Değeri 0.05'ten Büyük Çıktı, Tezime Ne Yazarım?
PhD
p Değeri 0.05'ten Büyük Çıktı, Tezime Ne Yazarım?
Analizinizi tamamladınız ve SPSS'ten "Sig. = 0.231" gibi 0.05'in üzerinde bir p değeri çıktı. İlk tepki genellikle şok ve hayal kırıklığı olur: "Hipotezim reddedildi, şimdi ne olacak?" Ancak istatistik dünyasında anlamlı olmayan bir sonuç, başarısız bir tez anlamına gelmez. Aksine, dürüstçe raporlanmış anlamsız bulgular bilime değerli katkı sağlar.
p Değeri Ne Anlama Gelir?
p değeri, "eğer H₀ (sıfır hipotezi) doğruysa, bu verileri veya daha aşırısını gözlemleme olasılığını" gösterir. p > 0.05 çıkması; gruplar arasında gerçekten fark olmadığı anlamına gelmez. Yalnızca "bu veri seti ile, bu örneklem büyüklüğünde, istatistiksel olarak yeterli kanıt bulunamadı" demektir. İki şeyin aynı olduğunu kanıtlamaz; sadece farkın kanıtlanabilir olmadığını gösterir.
p > 0.05 Çıkınca Yapılabilecekler
1. Örneklem büyüklüğünü sorgulayın: Küçük N ile büyük efekt boyutu bile anlamsız çıkabilir. Güç analizi (Power Analysis) yaparak örnekleminizin yeterli olup olmadığını kontrol edin.
2. Etki büyüklüğünü (Effect Size) raporlayın: Cohen's d, η², veya r gibi etki büyüklüğü ölçüleri, pratik önemi gösterir. Küçük örneklemde p > 0.05 çıksa bile büyük etki boyutu olabilir.
3. Sıfır hipotezini tartışın: "Anlamlı fark bulunamadı" bulgusu da bir bulgudur. Literatürde fark bekleniyordu ama siz bulmadınız — bu neden olabilir? Tartışma bölümünde bunu ele alın.
Tezde Nasıl Yazılır (APA Formatı)
Anlamsız sonuçları "başarısız" gibi sunmak yerine objektif ve akademik bir dille raporlayın:
"Deney ve kontrol grupları arasında akademik başarı puanları açısından istatistiksel olarak anlamlı bir fark bulunamamıştır, t(58) = 1.24, p = .220, d = 0.32. Bu bulgu, uygulanan programın bu örneklemde ölçülebilir bir etki yaratmadığını göstermektedir. Etki büyüklüğünün küçük-orta düzeyde (d = 0.32) olması, daha büyük örneklemlerle yürütülecek çalışmalarda anlamlı sonuçlara ulaşılabileceğine işaret etmektedir."
Hangi Analizler Anlamsız Sonuç Verse de Tezde Kullanılabilir?
| Analiz | p > 0.05 Durumunda |
|---|---|
| t-Testi | Gruplar arası fark kanıtlanamadı — etki boyutunu raporla |
| ANOVA | Grupların ortalamaları arasında anlamlı fark yok — post-hoc yapmana gerek yok |
| Korelasyon | İki değişken arasında doğrusal ilişki kanıtlanamadı |
| Regresyon | Model anlamsız — bağımsız değişkenler bağımlıyı yordamıyor |
Analizlerinizi yapmak için → t-Testi, ANOVA ve Korelasyon araçlarımızı kullanın.
Tip II Hata ve İstatistiksel Güç
p > 0.05 çıkmasının iki olası açıklaması vardır: (1) Gerçekte etki yoktur. (2) Etki vardır ama örneklem bunu tespit edecek kadar büyük değildir — bu durum Tip II Hata (β) olarak adlandırılır. İstatistiksel güç (1 − β), araştırmanın gerçek bir etkiyi doğru biçimde tespit etme olasılığıdır. Davranış bilimlerinde standart güç hedefi .80'dir; bu, gerçek bir etki varsa %80 ihtimalle anlamlı sonuç elde edileceği anlamına gelir.
Güç < .50 olan bir çalışmada p > .05 bulgusu, testin başarısızlığı değil; araştırmanın yetersiz güçte tasarlandığının göstergesidir. Bu yorumu tezinizin Kısıtlılıklar bölümünde şeffaflıkla belirtin.
Geriye Dönük Güç Analizi (Post-Hoc Power)
Veri toplanıp analiz yapıldıktan sonra "Peki gücüm neydi?" sorusunu yanıtlamak için geriye dönük güç analizi yapılabilir. G*Power yazılımında:
- Test türünüzü seçin (t-test, ANOVA vb.).
- "Post-hoc: Compute achieved power" seçeneğini işaretleyin.
- Elde ettiğiniz etki büyüklüğünü, α = .05'i ve N'inizi girin.
- Hesaplanan güç değerini raporlayın.
Önemli uyarı: post-hoc güç analizi tartışmalı bir uygulamadır; bazı metodologlar gözlenen etkiyi kullanarak güç hesaplamanın döngüsel bir mantık içerdiğini belirtir. Bu hesabı yorumlarken bu sınırlılığı belirtmek akademik dürüstlük gerektirir.
Eşdeğerlik Testi: "Fark Yok" Demek İçin
p > .05 bulmak, "iki grup arasında fark yoktur" anlamına gelmez; yalnızca bu veriyle fark kanıtlanamadığını gösterir. "Fark yoktur" iddiasını bilimsel olarak savunmak için Eşdeğerlik Testi (Equivalence Testing / TOST prosedürü) yapılmalıdır. Bu test, iki grubun ortalamaları arasındaki farkın önceden belirlenen "önemsiz fark" sınırları (equivalence bounds) içinde kaldığını istatistiksel olarak sınar. Bu yaklaşım, psikoloji, farmakoloji ve biyoeşdeğerlilik çalışmalarında giderek yaygınlaşmaktadır.
Null Bulguların Yayın Değeri
Yayın yanlılığı (publication bias) nedeniyle anlamsız bulgular, anlamlı bulgulara göre çok daha düşük oranda yayınlanmaktadır. Bu durum akademik yazın birikimini çarpıtmakta ve meta-analizlerin güvenilirliğini zedelemektedir. Son yıllarda "Registered Reports" formatı giderek yaygınlaşmaktadır: araştırmacılar veri toplamadan önce çalışmayı dergiye sunar; metodoloji kabul edilirse, sonuç ne olursa olsun (anlamlı ya da anlamsız) makale yayınlanır. Bu format özellikle null bulgular için önemli bir yayın kanalı açmaktadır.
Güç ve Örneklem Büyüklüğünü Savunmada Gerekçelendirmek
p > .05 bulan bir araştırmacı savunmada "Neden daha büyük örneklem almadınız?" sorusuyla karşılaşabilir. Bu soruya hazırlıklı olmak için şu argüman yapısını kullanın: "Güç analizine göre belirlenen minimum örneklem [N] kişiydi ve bu sayıya ulaşıldı. Elde edilen örneklemde tespit edilemeyen etkiler, etki büyüklüğü [değer] ile küçük düzeyde kalmaktadır. Bu bulgu, uygulanan programın anlamlı bir etki yaratmadığını değil; mevcut örneklem boyutunda tespit sınırının altında kaldığını göstermektedir. Daha büyük bir çalışma ile bu olasılığın test edilmesi önerilmektedir." Bu yapı hem metodolojik dürüstlüğü korur hem de bulguyu "başarısızlık" değil "sınır tespiti" olarak çerçeveler.
Sonuç: Anlamsız Bulgu Değersiz Bulgu Değildir
İstatistiksel anlamlılık eşiğine ulaşamamak, araştırmanın başarısız olduğu anlamına gelmez. Dürüstçe raporlanmış, güç analizi ile desteklenmiş ve etki büyüklüğüyle bütünleştirilmiş null bulgular, akademik bilgi birikimine değerli katkı sağlar. Null sonuçların yayımlanmasından kaçınılması yayın yanlılığına (publication bias) yol açarak meta-analizleri ve sistematik derlemeleri çarpıtmaktadır. Bu anlayışla, p > .05 bulan her araştırmacı bulgusunu titizlikle raporlayıp paylaşmakla hem bireysel akademik sorumluluğunu hem de bilimin kolektif bütünlüğünü korumuş olur.
Kaynakça:
Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Erlbaum.
Cumming, G. (2014). The new statistics: Why and how. Psychological Science, 25(1), 7–29.