Şaibeli Seçimler? İsviçreli Bilimadamları Ne Diyor?*

by Onur Yavuz

Onur Yavuz**

Oldukça gergin bir hazırlık döneminin ardından gerçekleşen 2014 yerel seçimleri hakkında kamuoyunda tartışmalar sürüyor. Özellikle Ankara’da seçime yolsuzluk karıştığı iddiaları gerek muhalefete yakın kitlesel medya, gerek sosyal medyada önemli ölçüde yer buldu ve buluyor. Bu minvalde geçtiğimiz günlerde Eren Yanık’ın Twitter’da paylaştığı aşağıdaki grafikle tartışma istatistik alanına kaydı. Bunu müteakip Erik Meyersson’un yaptığı bir analiz ortaya çıktı. Son olarak ise Dr. A. Murat Eren’in son iki gündür paylaştığı oldukça iyi data analizleri bulunuyor (Dr. Eren’in analizlerinin ciddiyetle okunmasini tavsiye ediyorum, Meyersson’un analizi biraz daha temkin gerektiriyor, Eren Yanık’ın paylaşımının ise aceleciliğin veri analizinde ne kadar yanıltıcı sonuçlar üretebileceğini gösteren bir örnek olarak üzerinde durulmalı).

Görselden de anlaşılacağı gibi grafik oldukça ilgi uyandırmış ve bolca paylaşılmış. Konuyla ilgili Twitter iletilerinin altında bazıları tarafından ortaya atılmış çok kesin ama bir o kadar da temelsiz “yolsuzluk” yargıları olduğu kadar bazı yerlerde seçime %100 üzeri katılım görünmesiyle ilgili kinayeli yorumlar vardı. Şahsen bu grafik (ve elbette Twitter iletisi/tartışması) bana gösterilip ne düşündüğüm sorulduğunda ilk cevabım “hiç” oldu. Çünkü gerçekten de paylaşılan grafik istatistiksel olarak hiçbir şey anlatmıyor, herhangi bir anlam ifade etmiyor ve istatistiğin toplumda çok hakim olunan bir konu olmamasından ötürü bilgi kirliliği yaratmaktan başka bir işlevi maalesef yok.

İlkin şunu hatırlatmakta yarar var: Yüzdeler üzerinden değerlendirme yapmak oldukça riskli bir uğraş. Bunun sebebini önceki yazımın sonlarında kısaca anlatmıştım. Tekrarlamak gerekirse yüzdeler görece değerlerdir ve göreliliğini temsil ettikleri kesin değerlerin ışığında değerlendirilmeleri gerekir. Örneğin, sadece beş üyeden oluşan bir derneğin beş üyesiyle Ankara’da kimsenin ruhunun duymadığı bir protesto gösterisi yaptığını ve ertesi gün ise internet sitelerinde “derneğimizin protesto gösterisi %100 üye katılımıyla gerçekleşti” yazdığını düşünelim. Her ne kadar toplumsal gerçeklik açısından gayet absürt bir duruma tekabül etse de bu duyuru matematiksel olarak doğru olacaktır.

Bu noktada daha ilerlemeden önce ufak bir not düşmek gerek. Doğru istatistik göze hoş gelen grafikler ve bunlara bakarak insanın önüne gelen ilk veri ile regresyon analizi yapması değildir. Doğru istatistik veriyi tanımak, verinin ne tür bir ham bilgi içerdiğine hakim olmak ile başlar ve bunun üzerine sorular/hipotezler geliştirerek “bebek adımlarıyla” ilerlemekten geçer. Dolayısıyla ilk adım, üşenmeden ve acelecilik etmeden sade, basit ama etraflı bir betimsel istatistik[1] olmalıdır.

Bu bağlamda yukarıdaki grafiği gördüğümde aklımdan geçen ilk şey seçimlere %100 üzerinde katılım görünen sandıklara “kayıtlı seçmen sayısı” oldu. Zira yukarıdaki dernek örneğinin anlatmaya çalıştığı gibi, 70 kişinin kayıtlı olduğu bir sandıkta %120 katılım çıkması ile 700 kişinin kayıtlı olduğu bir sandıkta aynı yükseklikte katılım görünmesi arasında ciddi bir fark var. Hülasa, katılımın yüzde kaç olduğu değil, katılımın hangi nüfus özelinde yüzde kaç olduğu sorusu anlam ifade ediyor. Bu noktadan yola çıkarak Ankara özelinde %100 üzeri katılım görünen sandıkların sayısı 180 olarak görünüyor ve dolayısıyla bu sayı Ankara’daki tüm sandıkların %1.5’ine tekabül ediyor. Fakat bu hala eksik ve yanıltıcı bir veri, zira söz konusu sandıklarda kayıtlı olan seçmen nüfusunun büyüklüğüne, burada kullanılan ve geçerli/geçersiz sayılan oylara, dolayısıyla bu tür bir mükerrer katılımın seçime genel etkisine dair hiçbir bilgi sunmuyor. Bu yüzden, bir sonraki adım sözü geçen 180 sandığa bir betimsel istatistik sorgusu yapmak oldu. Sonuçlar ise aşağıdaki gibiydi.

 

voterpop100plus

 

Burada gördüğümüz üzere kısaca, %100 üzeri katılım görünen sandıklarda en az 9, en fazla 315 kayıtlı seçmen bulunuyor. Ortalamada bu sandıklara kayıtlı seçmen sayısı 78, medyanda ise 50.5. Bu betimsel istatistikte görüldüğü üzere %100’den fazla katılım görünen sandıklara kayıtlı seçmen sayısı oldukça düşük. Örneğin %125 ile en yüksek katılımın göründüğü 1436 numaralı sandıkta 313 kayıtlı seçmen bulunurken burada 392 oy kullanılmış fakat 111 oy da geçersiz sayılmış. Gene en yüksek katılım oranı görünen sandıklardan 1117 numaralı sandıkta 20 kayıtlı seçmen görünürken 1010 numaralı sandıkta ise 32 kayıtlı seçmen görünüyor (Bu üç sandığın da Yenimahalle ilçesinde bulunduğunu ve bu ilçede seçimi %50.8 ile CHP’nin kazandığını not düşelim). Bu noktada kayıtlı seçmen sayısı ve katılım oranı arasında negatif bir istatistiksel ilişki (ters orantı) olup olmadığı anlamlı bir soru haline geliyor. Buna mukabil yaptığım regresyon analizinin sonucu ise bunu doğruluyor.

model1

Yukarıdaki sonuca göre Ankara genelinde kayıtlı seçmen sayısına eklenen her bir kişi ile genel katılım oranı %2.71 düşüş gösteriyor ve sonuç istatistiksel olarak yüksek düzeyde anlamlı. Bu bulgu çerçevesinde kayıtlı seçmen nüfusunun düşük olduğu bölgelerde daha güçlü bir seçmen mobilizasyonu, yüksek kayıtlı seçmen nüfusu barındıran yerlerde ise mobilizasyonun görece daha zayıf olmuş olduğu yorumu yapılabilir. Sandık görevlilerinin ve (bildiğim kadarıyla) polislerin görevli bulundukları (ikametgahları dışındaki) sandıklarda oy kullanıyor olmaları da bu tabloya eklendiğinde ve bunun dışında çıkan mükerrer oyların da yukarıda 1436 numaralı sandık özelinde gördüğümüz üzere (kurala göre rastgele çekiliş ile) iptal edildiğini göz önünde bulundurduğumuzda “Bazı yerlerde %100 üzeri katılım var!!!! Üstelik buralarda daha çok AKP kazanıyor!!!!!!!!!” gibi abartılı ve asabi tepkilerin çok anlamlı olmadığını görmek mümkün. Gelgelelim, bu konudaki tartışmayı somut verilerle bir sonuca bağlamak adına yukarıdaki bulgu ışığında anlam kazanan ve tartışmayı tamamlayan iki soru daha ortaya çıkıyor:

1) Ankara genelinde seçime katılım oranının AKP-CHP oy farkına bir etkisi var mı?

2) %100’den fazla katılım görülen 180 sandığın AKP-CHP oy farkına bir etkisi var mı?

Bu soruları cevaplamak için de iki yeni regresyon modeli hesapladım ve aşağıdaki sonuçlara ulaştım:

model2

 

Yukarıdaki modelde ilk sorunun cevabı bulunuyor. Bu sonuca göre Ankara genelinde seçmen katılımındaki her %1’lik artış AKP-CHP farkına 222 oy artışı olarak yansımış ve bu sonuç da istatistiksel olarak yüksek düzeyde anlamlı. Öte yandan aşagıdaki sonuçlar ikinci soruya dair. Buradaki verilere göre %100’ün üzerinde katılım görünen sandıklar özelinde seçmen katılımının AKP-CHP arasındaki oy farkına hiçbir etkisinin olmadıgı görülüyor, çünkü sonuç istatistiksel olarak anlamlı değil.

model3

Özetle, en başta da belirttiğim gibi Eren Yanık’ın paylaşmış olduğu grafik istatistiksel olarak hiçbir anlam ifade etmiyor. Türkiye gibi pek çok alanda kalite standardı iç açıcı olmayan bir coğrafyada hata, yolsuzluk vb. faktörlere karşı tetikte olmak makul bir durum teşkil etse de bunu doğru argümanlarla ve doğru dayanaklarla yapmak önemli. Her şeyden önemlisi tüm bu analizlerin (bu yazıda yapılanlar dahil) henüz resmi verilere dayanmadan yapılıyor olması.

Eren Yanık’ın bu paylaşımının ardından Erik Meyersson konuya farklı bir açıdan yaklaşarak aynı veri ile kendi analizini yaptı ve yayınladı. Şahsen Meyersson’un analizinde teknik bir problem görmedim, onun adımlarını izleyerek gittiğimde de (istatistik programı farkından ötürü) bazı ufak desimal farklılıklar dışında aynı sonuçlara ulaştım. Meyersson’un analizindeki (oldukça ciddi) problem hipotez üretimi ve veri sunumu aşamalarında ortaya çıkıyor.

Meyersson, ilçe ve alan değişkenlerini kontrol ederek yaptığı son regresyon modelinde istatistiksel anlamlılık değeri dahil olmak üzere her şeyi açıkladığı halde, yukarıdaki ilk modelinde yaptığının tersine bu kontrollü modelde çok küçülen regresyon değerinin pratik açıklamasını yapmayı ihmal ediyor. İlk modelinde regresyon değeri (Beta1) 5.86, yani her %1’lik geçersiz oy oranı artışı AKP-CHP oy farkının 5.86 oy oranında açılmasını sağlıyor. Bu açıklamayı yaptığı halde kontrollü modelde dramatik biçimde zayıflayan regresyon değerini okuyucuya açıklamadan atlıyor. Bir diğer deyişle, ilçe ve alan değişkenleri kontrol edildiğinde tüm oy havuzu içinde her %1’lik geçersiz oy oranı artışı AKP-CHP oy farkına sadece 0.4 oy katkıda bulunduğu halde bunu okuyucuya anlatmayi ihmal ediyor. Bu veri ortada bir yolsuzluk olduğuna dair tek başına ciddi bir gösterge bir teşkil etmekten istatistiksel olduğu kadar teorik bir nedenden ötürü de uzak[2]: Geçersiz sayılan oyların muhteviyatına dair elimizde veri yok. Yani tüm bu tartışmalar dönerken, kah açıktan kah üstü kapalı imalarla AKP’nin lider çıktığı sandıklardaki “geçersiz” oyların sayılmayan CHP oyları olduğu önkabulü ile konuşuluyor fakat bu oyların (ve ne kadarının) CHP mi yoksa AKP oyu mu olup da geçersiz sayıldığına dair resmi bir bilgi mevcut değil. Ayrıca bunların hangi nedenlerden dolayı (kaba bir kategorizasyonla bile olsa) geçersiz sayıldığına dair veri de mevcut değil.

Geçersiz oyların yaklaşık %65’inin AKP’nin lider çıktığı sandıklarda bulunmasının altında yatan sebepler tartışılırken eğitim seviyesi bir demografik değişken olarak tartışmaya (haklı biçimde) dahil edildiği halde atlanan birkaç nokta daha var.

Bunlardan biri seçmenlerin yaşı ve seçmenlik tecrübesi. Bu faktör özellikle seçmen mobilizasyonunun rekor seviyeye ulaştığı seçimler ışığında önem kazanıyor. Düne kadar oy vermeye gitmeyen yaşlı seçmenin bu sefer oy vermek için kitleler halinde evden çıkması ihtimali kadar, YSK verilerine göre yaklaşık 2.5 milyon yeni reşit olmuş bireyin bu sene seçmen nüfusuna katıldığı gerçeği önümüzde duruyor. Dolayısıyla Türkiye gibi genç bir nüfusa sahip ve ölüm oranının doğum oranına göre oldukça aşağılarda olduğu bir ülkede[3] büyüyen seçmen nüfusuna hangi toplum/seçmen segmentinin en çok “genç birey” ile katkıda bulunduğu sorusunu cevaplamak önemli.

Bir diğeri ise seçmen cinsiyeti. Seçmen nüfusuna en yoğun katkıyı yapan segmentte kadının sosyal ve siyasal etkinliği, kültürel kodlarının sosyal hayatta erkekten bağımsız ve yalnız başına hareket etme konusunda ne kadar serbest bıraktığı, buna ne kadar alışkın olduğu soruları seçmen davranışını anlamakta en az eğitim seviyesi kadar önem taşıyan faktörler. Zira tüm bu tartışmalar aslında “geçersiz” oylar hakkında kalitatif veriye sahip olmadan yapılıyor. Yani geçersiz sayılan oyların çoğunluğunun neden geçersiz olduğu, hangi partiye verilmeye çalışılırken hangi hatalardan dolayı geçersizleştiği sorgulanması ve önümüzdeki resmin sağlıklı biçimde anlaşılabilmesi için aydınlatılması gereken bir konu. 120.000 küsur geçersiz oyun ne kadarlık bir bölümünün de aslında AKP’ye verilmek istenirken eğitimsizlik, tecrübesizlik, bilinçsizlik ve hatta alışık olunmayan bir sosyal ortam olarak oy kabininde yaşanan stres gibi faktörlerle isabetsiz biçimde işaretlenmesi, belki üzerine (komik gelebilir ama) RABİA, Esma, ‘CHP’ye Hayır’ gibi şeylerin yazılması ihtimali göz ardı edilmemesi gereken ve ülkenin politik anatomisini daha iyi anlayabilmek için üzerinde durulması gereken bir ihtimal. Bunlara dair sağlıklı teoriler geliştirebilmek için ise sadece formal eğitim düzeyini bölgelere göre analize katmak oldukça yüzeysel kalacaktır. Zira bireylerin sosyal davranışlarını etkilemek konusunda formal eğitim düzeyinden çok kültür ve bunun elementleri olarak sosyal rol algısı, alışkanlıklar, medyaya ulaşım ve tüketim ve sınıfsal arkaplan (kabaca taşralı/kentli olarak bile ayrılsa) çok daha güçlü haberci faktörler teşkil edeceklerdir. Elimizdeki kitleye dair bu konularda temsil gücü yerinde, güvenilir ve kapsamlı istatistiksel araştırmaların (en azından benim bildiğim kadarıyla) olmaması da bu noktada “bu ülkenin üniversiteleri ne yapıyor” sorusunu sormayı gerektiriyor.lol

Tüm bu tartışmalardan bağımsız elbette bu konuşulan konuların bile somut anlam kazanabilmesi için öncelikle analizlerin resmi veriler ile yapılması gerektiği unutulmamalı. Gerek kantitatif, gerek kalitatif veri bağlamında bu kadar bilinmezlik ve belirsizliğin hakim olduğu bir ortamda Prof. Dr. Dani Rodrik gibi saygın bir akademisyenin gayet militanca bir üslupla Meyersson’un yazısını “seçim manipülasyonuna dair” çalışma tanımıyla paylaşması karşısında ise şahsen bir Zürihli olarak hayalkırıklığına uğradım.

* Yazının çeşitli aşamalarında öneri ve eleştirileriyle katkıda bulunmuş Volkan Çakır ve Ayda Erbal’a teşekkür ediyorum

** Zürih Üniversitesi ve ETH-Zürih

 

 

[1]Denek grubu içindeki örneğin demografik özelliklerin dağılımı (yaş ortalaması vb.) özelliklerin hesaplandığı, fakat değişkenler arası ilişkiler ve neden-sonuç çıkarımlarına dair analizleri içermeyen istatistik türü.

[2] Aslında bu noktada oy farkına en çok ve anlamlı etkiyi yapan değişkenin keşifsel bir analizle bulunması için kullanılması gereken doğru istatistiksel prosedürler Machine Learning ve spesifik olarak CART olurdu. Şahsen yapmayı da denedim ama maalesef bilgisayarım veri yükünü kaldıramadı ve sonuç alamadım.

[3] https://www.cia.gov/library/publications/the-world-factbook/geos/tu.html

2 Comments to “Şaibeli Seçimler? İsviçreli Bilimadamları Ne Diyor?*”

  1. Selam Onur,

    Yazini zevkle okudum ve etrafimdakilerle paylastim. Sonuclarin, istatistik gibi manipulasyona acik bir mecranin amaclar dogrultusunda ne kadar efektif kullanilabildigini cok guzel bir sekilde gosteriyor. Verinin guvenilirligini bir kenara birakirsak bile, sosyal medyada paylasilan bircok “analiz” tekrarlanabilirlik (replicability icin dogru ceviri mi?) ve seffaflik konusunda sinifta kaliyor.

    Bu konuda (Gezi sonrasindaki analizlerinle beraber) cok onemli bir is yaptigini dusunuyorum, o yuzden sunumla alakali ufak bir elestiride bulunacagim: Uslubundan cikardigim uzere (yanlissa luften duzelt) okuyucularinin minimal bir istatistik bilgisine sahip oldugunu varsayarak yaziyorsun. Kullandigin regresyon fonksiyonlari ne kadar basit olursa olsun, sonuclarini raw cikti olarak koymak yerine duzenleyip (stargazer ile mesela) sunarsan cok daha anlasilir ve etkili olacagini dusunuyorum.

    Selamlar,
    ve istatistik hakkinda yazmaya devam lutfen!

  2. Cok guzel bir yazi olmus. Ellerine saglik

Leave a comment