Veri serilerinin sahip oldukları değerlere bakarak bir anlam çıkarmak gerçekten güç bir iştir. Bu nedenle, bilimsel platformlarda salt değerlere bakmak yerine bu değer kümelerinin anlaşılmasını kolaylaştırmak amacıyla kısa ve öz değerler türetilir. Ortalama, tepe değer (mod), ortanca, varyans ve dörttebirlikler gibi istatistiksel olarak türetilmiş bu küçük veri setleriyle değerleri ve/veya veri serilerini betimlemeye, tanımlayıcı istatistik denilir. Her ne kadar, bu basitleştirilmiş küçük veri setleri aracılığıyla anlatım büyük oranda kolaylaştırılmış olsa da, bu değerlerin görsel bir ifade şeklinde sunulması veri serilerinin yapısı ve birbirleriyle olan ilişkileri hakkında büyük bir kavrama kolaylığı sağlamaktadır.
Şekil 1: Basit bir kutu grafiği |
Kutu grafiği, ilk kez 1969 yılında Amerikalı bir matematikçi olan John W. Tukey tarafından görsel bir veri sunum şekli olarak tanıtılmıştır. Günümüze kadar farklı sunum şekilleri ve ek parametrelerle zenginleştirilmiş değişik tipleri türetilmişse de temelde verilerin tanımlayıcı istatistiğinde yer alan beş değişkeni kullanmaktadır. Bu değişkenler; en küçük değer, 1.dörttebirlik (25.yüzdelik), ortanca, 3.dörttebirlik (75.yüzdelik) ve en büyük değerdir (Bkz: Şekil 1).
- Kutuyu ikiye ayıran hat şeklinde ifadesini bulan ortanca (Q2, %50) değeri aracılığıyla, veri serisinin merkezi eğilimi hakkında.
- Kutunun iki yanı (alt ve üst hattı) şeklinde ifadesini bulan 1. ve 3. dörttebirlikler (%25. ve %75.) aracılığıyla merkezi %50’yi ve kutunun iki yanındaki çubuklarla birlikte veri serisinin yaygınlığı hakkında.
- Kutunu genişliği ile ilişkili olarak basıklığı hakkında.
- Ve kutunun sağa ya da sola yakınlığı şeklinde ifadesini bulan çarpıklığı hakkında (Bkz: Şekil 2) bilgi sunmaktadır.
Şekil 2: Çarpıklığa göre dağılım tipleri (Negatif, Normal ve Pozitif Çarpık Dağılım) |
Kutu grafiklerinin birçok değiştirilmiş şekli mevcuttur. Bunlardan en sık kullanılanlarından birisi de, uç değerlerin kutunun alt ve üst taraflarında yer alan çubukların dışında ayrıca gösterildiği şeklidir. Bu, kutunun alt ve üst hatları arasında kalan çeyrekler arası (interquartile range, IQR) mesafenin kutuya her iki yönde bir buçuk katı mesafeden (1,5*IQR) daha uzakta (küçük ya da büyük) değerlerin ayrı birer sembolle ifadesi şeklinde (tümü uç değer şeklinde) olabilmekte. Ya da buna ek olarak üç katı (3*IQR) mesafeden daha uzakta kalan değerlerin de ayrıca farklı bir sembolle ifadesinin yer aldığı aşırı uç değerlerin eklendiği biçimleri de olabilmektedir (Bkz: Şekil 3).
Şekil 3: Kutu grafiğinin geliştirilmiş şekillerindeki temel prensipler. |
EXCEL'DE KUTU GRAFİĞİ HAZIRLAMA
KUTU GRAFİĞİNE ORTALAMA DEĞERLERİNİ EKLEME
Emeğiniz için teşekkür ederim çok yardımcı oldunuz.
YanıtlaSil