Statystyka wyborcza

2011-12-16 00:00:00 +0000


Rosyjsko- i polskojęzyczne strony zdobywają szturmem analizy statystyczne rosyjskich wyborów parlamentarnych wykazujące interesujące anomalie. Rosyjska komisja wyborcza ma tę przewagę nad polską, że od razu po wyborach udostępnia surowe wyniki z dokładnością do poszczególnych komisji wyborczych. Dzięki temu rosyjska blogosfera mogła szybko przeanalizować je i odnotować rozmaite anomalie:

http://keleg.livejournal.com/353195.html

Dla nie władających językiem rosyjskim: wyniki innych partii niż Jedinaja Rossija (JR) są zbliżone do rozkładu normalnego. Rozkład wyników JR ma wyciągnięty ogon w stronę 100% z licznymi pikami na okrągłych liczbach. Hipoteza: czynownicy-debile fałszując wyniki w swoich komisjach podawali okrągłe wyniki.

Z wynikami tymi polemizuje niejaki Sergiej Kuźniecow:

http://eruditor.ru/k/?15

W skrócie jego argumentacja wygląda następująco: rozkład normalny miałby sens tylko w odniesieniu do poszczególnych regionów albo jakoś inaczej zdefiniowanych jednolitych grup wyborców. Piki są naturalnym wynikiem kumulacji wyników ułamkowych w sumarycznych wynikach ze wszystkich regionów i występują też w wykresach innych partii. Dalej, jeśli znormalizuje się wyniki według rozmiarów okręgów wyborczych to dla wszystkich partii wychodzi w miarę rozkład normalny.

Kuźniecow przyznaje jednak, że w wynikach JR zostaje nadal dziwny długi ogon, którego nie potrafi wyjaśnić. Kolejną anomalią jest cykliczność wyników JR powyżej 60% z krokiem ok. 5%. Ostateczny wniosek jest taki, że dowodów na fałszerstwo nie ma ale anomalie występowały. W 1/3 regionów mogłyby one być wynikiem fałszerstwa centralnego (ogony), w kolejnej 1/3 - lokalnego (piki), a w 1/3 nie występują żadne anomalie. Pierwsza grupa jest reprezentowana głównie przez republiki północnokaukaskie.

To nie jedyna analiza — trudno mi za nimi wszystkimi nadążyć, bo pojawiają się ich dziesiątki, linkowanych w komentarzach i mikroblogach. Kolejna ciekawa jest tutaj:

http://kobak.livejournal.com/101512.html

Autorzy oraz liczni komentatorzy odnotowali zwłaszcza osobliwości narodowego głosowania w… republikach północnokaukaskich. Np. w Osetii w większości wiejskich okręgów frekwencja wyniosła równo 75%. Wynik ten zupełnie mnie nie dziwi, zwłaszcza od kiedy miałem okazję z pierwszej ręki poznać relację męża zaufania w wyborach prezydenckich w Kabardyno-Bałkarii w 2002 roku. Wynikiem 87% wygrał w nich lokalny kacyk Walerij Kokow. Z relacji komisji jednoznacznie wynikały chamskie i dokonywane na oczach obserwatorów fałszerstwa — i co z tego? Europejczycy kompletnie nie rozumieją mentalności rosyjskiej polityki i nawyku bezkrytycznego akceptowania lewych statystyk i trawy pomalowanej na zielono nawet w najbardziej oczywisty sposób. Wyobrażamy sobie, że z takimi rzeczami można pójść do komisji wyborczej, potem do sądu i coś się stanie. Tymczasem po prostu… nie dzieje się nic.

Osoby chcące głębiej analizować wyniki rosyjskich wyborów powinny zapoznać się z podręcznikiem wykrywania oszustw finansowych, który skupia się przede wszystkim na analizie dużych zbiorów danych. Na przykład przy pomocy prawa Benforda. Autorzy komentarzy na w/w stronach o nim wspominają, ale nigdzie nie widzę by ktoś to faktycznie zrobił. Surowe dane można pobrać ze strony http://www.kartaitogov.ru/

Temat jest obecny także w polskiej blogosferze (Krzywa Gaussa a krzywy ryj) i analogiczne pytania zostały od razu postawione wobec wyborów polskich. Niestety polska blogosfera nastawiona spiskowo była zbyt leniwa by faktycznie coś policzyć, więc zrobił to za nią Jarosław Flis, nie wykazując szczególnych anomalii (Pytania o normalność, nawiasem mówiąc przy użyciu miłego mi programu SPSS).

Jeśli już jesteśmy przy analizie statystycznej różnych zjawisk to podobne pytanie pojawiły się także przy wynikach matur z 2010 roku, gdzie w pięknej krzywej dzwonowej widać zabawną dziurę w okolicach liczby 21 punktów. Która “przypadkiem” była progiem zdawalności — prawie nikt nie dostał “nie zdającego” wyniku 20 punktów, za to znacznie nadreprezentowana jest “ledwie zdająca” wartość 21. Egzaminatorzy naciągali wyniki z litości? Chyba tak. Trochę szkoda, bo ci “graniczni” potem w podobny sposób przechodzą przez studia a następnie spełniają się zawodowo dukając w urzędach, pisząc bełkotliwe uzasadnienia decyzji czy dziwaczne przepisy…

Lekcja dla rosyjskcih demokratów na przyszłość — nie publikować dokładnych danych z wyborów, bo wywołuje to niepotrzebne spekulacje. Bierzcie przykład z Polaków, którzy nie dość że nie udostępniają surowych danych wyborczych to jeszcze od tego roku dzięki poprawce senatora Rockiego dostali dodatkowe narzędzie do ograniczania dostępu profanów do nieprzefiltrowanych danych, co może “destrukcyjnie oddziaływać na otoczenie, a zwłaszcza powodować objawy paniki, przez rozpowszechnianie nieprawdziwych i szkodliwych wiadomości itp.” :)

Aktualizacja: Pobrałem dane, zostawiłem tylko wyniki dla poszczególnych partii (patrz plik DAT) i zapuściłem na nich metodę Benforda. Wynik poniżej — jak widać dane z komisji nie odbiegają zbytnio od rozkładu oczekiwanego.