2 grubu nasıl karşılaştırırsınız? : T-test

2 grubu nasıl karşılaştırırsınız? T-test ile…

Problem çözmekteki amacımız, kök nedeni bulup ortadan kaldırmak ve problemin tekrar etmesini önlemek. Nedenleri ararken prosesin girdilerinden hangisinin önemli olduğuna karar vermemiz gereken durumlar oluyor. Ya da bir iyileştirme yaptıktan sonra önceki durumla arada gerçekten fark var mı karşılaştırması… İki çözüm arasından seçim yapmamız gerektiği durumlar da oluyor.

Tüm bu durumlarda iki grubu karşılaştırmak ve istatistiksel olarak fark var mı anlayabilmek için kullandığımız T-test var. 

T-testin yaygın kullanımı, iki grubun ortalamaları açısından karşılaştırılmasıdır. Hipotez testinde, bir sürecin veya çözümün ilgilenilen popülasyon üzerinde gerçekten bir etkiye sahip olup olmadığını veya iki grubun birbirinden farklı olup olmadığını belirlemek için kullanılır. 

Yirmi beş farklı ürünü rastgele seçtiğimizi ve bir özelliğini ölçtüğümüzü düşünelim. Ölçtüğümüz bu özelliğine göre bu iki ürün arasında fark olup olmadığına karar vereceğiz.

Yapılan her iki ölçümü de kaydetmek ve iki grup arasında ortalamalar açısından fark var mı karşılaştırması yapmak istiyoruz. Bir t-testi kullanarak bu iki grup arasındaki farkı test edebilirsiniz.

Boş hipotez (H0) => grup ortalamaları arasında fark yoktur.

Alternatif hipotez (Ha) => grup ortalamaları arasında fark vardır.

Boş hipotezi, karşılaştırdığınız gruplar arasında “fark yoktur” şeklinde oluşturmanız gerekir. Alternatif hipotez de bunun tam tersi, yani “fark vardır” olacaktır.

T-test uygulamak için gereklilikler

T testi verilerinizin aşağıdaki özelliklere sahip olması gerekir:

  • bağımsız
  • normal dağılıma uygun
  • karşılaştırılan her grup içinde benzer miktarda varyansa sahip (varyans homojenliği)

Verileriniz bu varsayımlara uymuyorsa, eşit olmayan varyanslara sahip veriler için Wilcoxon Signed-Rank testi gibi, T-testine parametrik olmayan bir alternatif deneyebilirsiniz.

Hangi T-testi kullanacağınıza nasıl karar vereceksiniz?

T-test : Tek örnekli mi, iki örnekli mi, eşleştirilmiş mi?

  • Gruplar tek bir popülasyondan geliyorsa (örneğin, bir iyileştirmeden önce ve sonra ölçüm), eşleştirilmiş bir T-testi yapın.
  • Gruplar iki farklı popülasyondan geliyorsa (örneğin, iki farklı tür veya iki farklı şehirden insanlar), iki örneklemli bir T-testi gerçekleştirin.
  • Standart bir değerle karşılaştırılan bir grup varsa (örneğin, bir ölçüm değerinin 12mm ile karşılaştırarak), tek örnekli bir T-testi gerçekleştirin.

T-test : Tek yönlü mü yoksa iki yönlü mü?

  • Sadece iki popülasyonun birbirinden farklı olup olmadığını önemsiyorsanız, iki yönlü bir T-testi yapın.
  • Bir popülasyon ortalamasının diğerinden büyük mü yoksa küçük mü olduğunu bilmek istiyorsanız, tek yönlü bir T-testi yapın.

Bizim örneğimizde gözlemleriniz iki ayrı popülasyondan geliyor, bu nedenle iki örneklemli bir T-testi yaparız.

T-testin formülleri üzerinde durmadan sonuçların nasıl yorumlanacağına geçelim. Bu testlerin hangisini yapmasına karar verdikten sonra kullanılabilecek SPSS, Minitab, gibi yazılımlar var.

T-testi nasıl yorumlayacağız?

2 grubu nasıl karşılaştırırsınız? : T-test
T-test sonuç

Bu çıktı şunları sağlar:

  • Neyin karşılaştırıldığına ilişkin açıklama, çıktı tablosundaki veri olarak adlandırılır.
  • T-değeri: -33.719. Negatif olduğuna dikkat edin. Çoğu durumda, yalnızca farkın mutlak değerini veya 0’dan uzaklığı önemsiyoruz. Hangi yönün olduğu önemli değildir.
  • Serbestlik derecesi (df: degrees of freedom): 30.196. Serbestlik dereceleri, örneklem büyüklüğünüzle ilgilidir ve karşılaştırma yapmak için testinizde kaç tane “serbest” veri noktasının olduğunu gösterir. Serbestlik derecesi ne kadar yüksekse, istatistiksel testiniz o kadar iyi çalışacaktır.
  • P-değeri: 2.2e-16 (yani 2.2 önünde 15 sıfır). Bu, şans eseri bu kadar büyük bir t değerini görme olasılığınızı açıklar.
  • Alternatif hipotezin bir açıklaması (Ha). Bu testte Ha, bir fark vardır demektir.
  • % 95 güven aralığı. Bu, %95 güvenilirlik ile farklı ya da farksız olduğunu gösteren sayı aralığıdır. Daha büyük veya daha küçük bir aralık istiyorsanız, % 95 değiştirilebilir, ancak % 95 çok yaygın olarak kullanılır.
  • Mean : Her grup için ortalama ölçüm uzunluğu.

Çıktı tablosundan, örnek verilerimiz için ortalamalardaki farkın -4.084 (1.456 – 5.540) olduğunu ve güven aralığının ortalamalardaki gerçek farkın -3.836 ile -4.331 arasında olduğunu gösterdiğini görebiliriz.

P değeri : 2.2e-16 < 0.05 =>  Ortalamalar arasında fark vardır (Ha hipotezini kabul ederiz.)

P değeri < 0.05 => Ha doğru

P değeri > 0.05 => H0 doğru

T-testte dikkat edilmesi gerekenler

İkiden fazla grup varken çoklu t-testi yapma hatasına düşmemek gerekir. Aksi takdirde p değerinin anlamını yok edersiniz ve bu da veriler hakkında hatalı sonuçlara yol açar. Birden çok t testi yerine, birden çok grup analizine başka istatistiksel yaklaşımlar da vardır – varyans analizi yaklaşımı gibi.

  • Parametrik test (t testi ve z testi) ve parametrik olmayan test (işaret testi ve Wilcoxon Signed-Rank testi) bir üretim ortamında kullanım için uygundur.
  • Hipotez testinin uygulanması, üreticilerin kalite verilerini daha iyi anlamalarına ve üretim kontrolüne rehberlik etmelerine olanak tanıyacaktır.
  • Hipotez testi, aritmetik ortalama, toplam ve aralık gibi yalnızca tanımlayıcı bir istatistiğin kullanılmasını sağlamada kanıt sağlar. Ürün veya hizmet kalitesinin panoramik bir görünümünü sağlamaz.

Belirli bir analiz için hangi karşılaştırma testinin kullanılacağına dair karar, sonuçlarınız hakkında tarafsız ve doğru kararlar vermeniz açısından büyük önem taşır. Analizlerinizi dikkatle seçmeli ve ne tür bir analizin kullanılacağına dair herhangi bir şüpheniz varsa profesyonel bir istatistikçiye danışmalısınız.

İstatistiksel araçlar konusunda T-test dışında farklı konularda bilgi almak isterseniz İstatistiksel Araçlar linkinden ulaşabilirsiniz.

Online Yeşil Kuşak eğitiminde bu aracın hangi durumlarda kullanıldığını, Excel dosyası ile uygulamasını öğrenebilirsiniz. Eğitim dosyasını Excel dosyasını alıp daha sonraki karşılaştırmalarınızı da bu dosya üzerinde yapabilirsiniz. Eğitimin detaylarına bu linkten ulaşabilirsiniz.

Kaynakça :

http://www.texasoft.com/tutorial-statistics-compare-2-groups.htm

https://www.scribbr.com/statistics/t-test/

https://www.qualitymag.com/articles/86581-the-importance-of-hypothesis-testing-in-quality-management

Sorularınız için bize ulaşın: Yalın Dünya – Linkedin § Yalın Dünya – Instagram