Blog ve Yorumlar

Analizlerin Ruhu 1 – Korelasyon Analizi

Bizim işimiz… İstatistik, analizler, yorum yapma ve sonuca varmaktan oluşan, her parçasını bir başkasının üstlendiği bir süreç. Çok karmaşık değil, çok basit de değil. Problem şu ki sürecin içinde yer alan herkesin her zaman aynı perspektife sahip olmasını sağlamak çok kolay olmuyor. Araştırmaların tasarımı müşterinin ihtiyaçlarına dayanıyor ve bazen sınırlar zorlanıyor. Bu zorlama önce tasarımın olanakları ile sonra veri toplama sistematiğinin olanakları ile sınırlanıyor ancak, bu iki sınırlama da aslında olabildiğince esnetilebilen özelliklere sahip. Bu safhalarda kuralları esnetmek yada katılaştırmak mantıksal bir çözümleme (analiz) ile mümkün olabiliyor.
Bu yazıya konu olan husus “istatistik” ve ilk bu perspektiften bakıldığında esnemek iradeye ve mantıksal çözümlemelere bağlı değil. İstatistik basitçe bilgi toplama, derleme, düzenleme ve düzenlenen bilginin (verinin) önce matematiksel ifadesini yapma, devamında da bu düzenlenmiş bilgilerden hareketle çözümleme / genelleme ve sonrasında tahmin yapma yönteminin adı. Bilgi toplama da, derleme de, derlenmiş bilgiden hareketle çözümleme yapmak da teorik bir temele dayanıyor.
Araştırmacı perspektifinden bakınca; bir saha sürecinin de, bir tasarım sürecinin de “istatistiği esas alması” mesleki bir gereklilik ve hatta zorunluluk. Yani araştırmacının bilmesi / benimsemesi gereken şey, yürüttüğü işin sadece mantık ve sadece matematik temele değil, istatistiki bir temele sahip olduğu gerçeğidir. Ya analizlerimiz; daha ilerletelim ya modellerimiz?
Modellerimiz; aynen istatistik gibi sınanmış bir istatistiksel geçmişe dayanır. Yani her yaptığımız (istatistik) analiz ile yeni bir bilgi elde ettiğimiz gerçeğini de hep aklımızda tutmamız gerektiğini ve bu bilgi (istatistiksel veri) dağarcığının bizler -sadece istatistikçilerin değil- aynı zamanda araştırma tasarımı yapanlar tarafından da doğru yorumlaması gerektiği gerçeğini anımsatmalıdır. Örneğin yaptığımız yığınla araştırma ile artık çikolata tüketimi ile ihtiyaç arasında bir “KORELASYON” olmadığını öğrendiysek artık tasarımımızda hala bu ilişkiyi aramaya çalışmak aslında yaptığımız tasarımı da bozar- etkisizleştirir, odağımızı kaçırmamıza sebep olur.
Bu yazıya Korelasyon Analizi’ni konu ettik. Basit bir analiz olduğu için değil de en içselleştirilmiş ve hepimizin aklına ilk gelen analiz olduğu için. Aslında şöyle diyelim, düz mantığımızı işlettiğimiz ve belki de kendi yetilerimizle en kolay izah edebildiğimiz analiz olduğu için.
Teknik olarak korelasyon, iki bağımsız değişken arasındaki sadece doğrusal ilişkinin gücünü (derecesini) ve yönünü ölçen, -1 ve +1 arasında değer alan bir katsayıdır. (+) değer alması değişkenlerin birbirini artırıcı, (-) değerde olması ise değişkenlerin birbirini azaltıcı etkisi olduğu anlamına gelir. İlişkinin yönü (+ / – değer alması) ilişkinin gücünü etkilemez.
Korelasyon katsayılarının düşük, orta, yüksek şeklinde sınıflandırılması ve genelleştirilmesi uygun değildir. Mesela psikometride (psikoloji + istatistik) karşımıza çıkan 0.8′lik bir korelasyon değeri ile ekonometride (ekonomi + istatistik) karşımıza çıkan ve 0.8 olan bir korelasyon değeri aynı kabul edilemez çünkü, farklı hassasiyetlerde ve tekniklerle ölçümlenen değerlerden hesaplanmışlardır, yani subjektiftirler.
Ayrıca korelasyonun bir neden-sonuç ilişkisi olmadığını da söyleyebiliriz; yani iki değişken arasında korelasyon bulduğumuzda değişkenlerden birinin sadece diğerinin nedeni (yada sonucu) olduğuna inanmak doğru değildir, bize daha ayrıntılı incelenmesi gerektiği bilgisini / ipucunu vermeye yarar.
Son olarak bu konuyla ilgili üniversitelerde -öğrenciyken bana da- verilen bir örneği paylaşmak isterim; İskandinavya’da 19. yüzyılın sonu ve 20. yüzyıl için gözlemlenen birçok değişkenden biri ülkedeki leylek sayısı, diğeri ise yıllık çocuk doğumlarıymış ve iki değişken arasında yüksek pozitif korelasyon olduğu görülmüş. Buradan hareketle ülkedeki çocukların leylekler tarafından getirildiğine inanmak doğru olmasa gerek! Aslında bu değişkenler oradaki ekonomik göstergelerle birlikte değerlendirildiğinde gelişmenin, şehirleşmenin gerilediği de saptanmış. Aslında leylek sayısı da, çocuk doğumları da azalan bir trende sahipmiş ve iki değişken arasındaki korelasyonun nedeni de buymuş.
İşte ”analizin ruhu” dediğimiz şey de budur. Çocukları leylekleri getirmediğini biliyorsak artık bu iki değişken arasındaki korelasyonu aramamız sadece teorik olur ama ruhumuzu dışarıda bırakmış oluruz.
Başa dönersek; herbir araştırma süreci içinde pek çok parametreyi dolayısıyla ipucunu barındırır ve ancak bu ipuçlarının tamamına hakim olmak (ya da tamamına yaklaşmak) bizi doğru tahmin yapmaya götürür. Bazen basit bir cross tablo ile görebileceğimiz ilişkileri karmaşık analizlerde aramak gibi bir efor yorgunluğu yaratabilir.
Veya kuru kuruya ve her tür veriye her tür analizi uygulamak gibi ruhsuz bir faaliyete dönüşebilir. Veri nihayetinde sayısaldır ve ruhu yoktur. Oysa analiz veriye ruh katma işi olmalıdır ve daha tasarım aşamasında biriktirdiklerimiz ile bu ruh oluşmalıdır.

Yazar : admin

Eylül 23, 2013

0

Blog ve Yorumlar, Bültenler

Diğer yazıları okuyun

Yorum yazın