?

Log in

No account? Create an account
 

Отчет наблюдателя: выводы - Хочу странного

About Отчет наблюдателя: выводы

Previous Entry Отчет наблюдателя: выводы 9 дек, 2007 @ 01:10 Next Entry
После окончания работы наблюдателем (см. отчеты о начале голосования, его ходе, и подсчете голосов), мне стало чрезвычайно интересно попытаться сопоставить результаты голосования с результатами других участков. Результаты оказались потрясающими - несмотря на довольно-таки положительный тон моего отчета и отсутствие нарушений, я Вам сейчас нарисую просто шикарную общую картину повсеместных подтасовок. Итак, поехали:


СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ЦИК



Проанализируем для начала результаты голосования по району Ховрино:

Явка:
Явка избирателей в Ховрино

В среднем: 52.49±2.74%; ср.кв.отклонение: 4.08; 95%-й доверит. интервал для величины: от 44% до 61%
Среднее по Москве: 55.36% (+2.87%)

Процент набранный Единой Россией (число проголосовавших за ЕР к числу голосовавших)
Процент ЕР в Ховрино

В среднем: 46.70±2.63%; ср.кв.отклонение: 3.92; 95%-й доверит. интервал: от 39% до 55%
Среднее по Москве: 53.86% (+7.16%!)

Уровень поддержки ЕР (число проголосовавших за ЕР к числу избирателей)
Поддержка ЕР в Ховрино

В среднем: 24.48±1.64%; ср.кв.отклонение: 2.45; 95%-й доверит. интервал: от 20 до 29%
Среднее по Москве: 29.82 (+5.34%!!)

Погрешность для средних величин дана для интервала соответствующего 99,7% доверительной вероятности. Черные линии горизонтальные на графиках соответствуют уровню среднего. Все величины в оценках считались распределенными по нормальному закону. Для проверки на нормальность использовался тест Шапиро-Уилкса с уровнями значимости 0.01, 0.05, 0.10. Для явки избирателей на выборы и уровня поддержки ЕР тест прошёл, а вот "процент за ЕР" - нет (принят для 0.01, отвергнут для 0.05 и 0.10 что говорит о том, что распределение, скорее всего, не является нормальным, хотя и не очень далеко от него). Таким образом, к оценкам "процента голосов за ЕР" надо относится осторожно. В расчетах не учитывался выброс в лице УИК №3162.

В общем, если кто еще не понял - какие-то очень низкие у меня на участке и явка (ну это еще куда ни шло) и процент голосовавших за ЕР (а этот разрыв объяснить уже сложно). Но это еще цветочки - ягодки дал корреляционный анализ явки избирателей с числом проголосовавших за ЕР:

Регрессионный анализ для Ховрино

Круто! Коэффициент корреляции составляет 0.94 - это однозначно свидетельствует о сильной зависимости процента набранного ЕР от явки избирателей. Линия регрессии (красная линия на рисунке) соответствует формуле
"Процент набранный ЕР = -1.08% + 0.91 * Явка". Иными словами, можно с высокой достоверностью утверждать, что каждый дополнительный процент явки приносил ЕР лишних 0.91% в итоговом раскладе голосов в то время, как ожидаемая цифра должна была составить 0.00% (изменение числа голосовавших избирателей не должно менять расклада сил). Для сравнения: с учетом того, что у ЕР было около 47% голосов избирателей, а явка в среднем составила 52%, то вброс 1% бюллетеней (от числа избирателей, т.е. процентов явки) "за ЕР" приводил бы к повышению доли ЕР примерно на 0.1*(1-0.46)/(0.52+0.01) ~ 1.01%.
Возможные интерпретации данного явления:
1. Случайное совпадение (вероятность данного сценария - величина порядка 5%)
2. Колебания числа голосовавших обусловлены по большей частью вбросом бюллетеней за ЕР (вероятность оценить трудно, но она весьма мала, т.к. колебания явки вполне укладываются в нормальное распределение, и это можно интерпретировать как то, что помимо "прибавки" голосов, ЕР на половине участков должна была "убавить" себе голосов)
3. КОИБ начиная с некоторого порогового значения начинали врать, приписывая ЕР голоса всех вновь голосующих (выглядит вполне вероятно, и как мы сейчас покажем, и имеет место быть)
4. Избирателей "зазомбировали" телеящиком, так что какая-то часть людей поддалась призыву прийти на выборы, причем 90% из пришедших проголосовали за ЕР (еще одна вполне вероятная гипотеза, но не сходится с анализом результатов на участках без КОИБ)


ЗДЕСЬ БЫЛА ОШИБКА ПРИ КОНВЕРТАЦИИ ИСХОДНЫХ ДАННЫХ!
ПРАВИЛЬНЫЙ ГРАФИК:

корреляция по Ховрино (исправлено)

Для сравнения - привожу результаты ТИК #17 "Сокольники" Восточного округа, где КОИБы не использовались (черная линия - средние результаты на аналогичном графике по "Ховрино")

Явка:
Явка в Сокольниках
В среднем: 55.69±3.59%

Процент набранный Единой Россией (число проголосовавших за ЕР к числу голосовавших)
Процент голосов за ЕР в Сокольниках
В среднем: 44.99%±3.07%

Уровень поддержки ЕР (число проголосовавших за ЕР к числу избирателей)
Уровень поддержки ЕР в Сокольниках
В среднем: 25.02±2.17%

Корреляция явки и процента ЕР
Корреляционная зависимость Сокольники

Опа! Шикарная получилась картина, не правда ли? Корреляционной зависимости между явкой и числом голосов за ЕР - как ни бывало!

Сразу отмечаем четыре "особых" точки - "выбросы" явки на участках 1227 и 1322, высокий результат ЕР на участке 1235 и необычный "провал" участка 1236 при, опять же, высоком результате ЕР. Участки с номерами 3xxx идут "вне конкурса" - к счастью число избирателей на них невелико, а потому мы их игнорируем с самого начала. К сожалению, оставшихся 13 участков маловато для построения сколь-либо внятной статистики, а потому - позвольте мне ввести в рассмотрение еще один район Восточного округа г. Москвы - ТИК №6 "Измайлово".

Корреляция явки и процента ЕР (Сокольники + Измайлово)
Регрессионный анализ: изначально

Вот это картина маслом, не находите? Видна куча выбросов и общая картина где Единая Россия набирает тем меньше голосов, чем больше людей пришло голосовать! Впрочем, корреляция довольно слабая - в "чистом" виде коэффициент корреляции составляет -0.25. Однако у нас не проходит тест Шапиро-Уилкса для цифр явки и (катастрофически!) для цифр "поддержки ЕР". Давайте "отсеем" явно выбивающиеся из общего тренда точки.

Корреляция явки и процента ЕР по Сокольникам+Измайлово после отсева 7 УИК из 50
Регрессионный анализ: после фильтрации

О! Вот теперь тест Шапиро-Уилкса проходится "на ура" по всем трем характеристикам! Вдобавок, коэффициент корреляции поднялся до -0.65, а среднеквадратичное отклонение заметно снизилось. Теперь каждый лишний процент явки, по нашим оценкам снижал процент голосов ЕР на 0.72%. Давайте посмотрим на графики:

Явка:
Явка по Сокольникам и Измайлово
В среднем: 53.38±1.39% (без фильтрации: в среднем: 54.17±1.94%).
Среднеквадратичное отклонение: 3.04; 95%-й доверительный интервал: от 47.31% до 59.46%
Отличие от варианта КОИБ: +0.89% (в рамках стат. погрешности совпадает с вер-ю > 99.7%)

Процент набранный Единой Россией (число проголосовавших за ЕР к числу голосовавших)
Процент ЕР в Сокольниках и Измайлово
В среднем: 46.85±1.74% (без фильтрации: в среднем: 47.46±1.91%)
Среднеквадратичное отклонение: 3.79; 95%-й доверительный интервал: от 39.27% до 54.44%
Отличие от варианта КОИБ: +0.16% (в рамках стат. погрешности совпадает с вер-ю > 99.7%)

Уровень поддержки ЕР (число проголосовавших за ЕР к числу избирателей)
Уровень поддержки ЕР в Сокольниках и Измайлово
В среднем: 25.02±0.76% (без фильтрации: в среднем 25.66±1.28%)
Среднеквадратичное отклонение: 1.66; 95%-й доверительный интервал: от 21.63% до 28.26%
Отличие от варианта КОИБ: +0.54% (в рамках стат. погрешности совпадает с вер-ю > 99.7%)

Цветами выделены результаты, существенно отличающиеся от средних: желтым - имеющим вероятность менее 16%, красным - менее 2.5%, черным - менее 0.15%. Список "неправильных" участков следующий (звездочкой отмечены "отфильтрованные" на начальном этапе)

1. УИК 1025*: высокий процент голосов за ЕР - 57.65%. Участок уникален также большим числом людей, голосовавших по открепительным - 105 человек. Число проголосовавших практически один-в-один совпадает со средним. Возможно случайное стечение обстоятельств, но вероятнее наличие нарушений
2. УИК 1030*: очень высокая явка - 67.15% плюс высокий процент голосов за ЕР - 57.81%. Практически наверняка результаты подтасованы
3. УИК 1031*: довольно высокий процент голосов за ЕР - 54.21%. Скорее всего случайность
4. УИК 1032: низкая явка: 48.74%. Скорее всего случайность
5. УИК 1034*: очень высокая явка - 63.11% и низкий процент голосов за ЕР - 39.21%. Абсолютно непонятная точка - народ там что-ли вброс "против ЕР" устроил?
6. УИК 1037: довольно высокий процент голосов за ЕР - 54.09%
7. УИК 1227*: очень высокая явка - 63.76%. Скорее всего случайность
8. УИК 1232*: очень высокая явка - 63.76% плюс значительный процент ЕР - 51.32%. Возможно, случайное стечение обстоятельств
9. УИК 1236*: очень низкая явка - 43.35% плюс значительный процент ЕР - 53.38%. Возможно, случайное стечение обстоятельств

Для дальнейшего анализа желательно бы выслушать наблюдателей с этих участков - но сделать это, увы, невозможно. Были ли нарушения на указанных 9 участках или просто моя модель не описывает ряд ситуаций без этой информации невозможно. Так что ограничимся следующим наблюдением - если выкинуть "странные" результаты, то цифры явки и процента людей голосовавших за ЕР в трех абсолютно разных районах Москвы совпадают (погрешность в пределах статистической нормы).

ИТОГИ и ВЫВОДЫ



Голосование на участке 475 было честным насколько его только можно было обеспечить наблюдателю. Все цифры, считавшиеся без КОИБа посчитаны с погрешностью не более трех голосов. Более, того, если я не ошибся в статистических выкладках, то даже проценты голосов КОИБ посчитал верно - полученные цифры подтверждаются данными с других участков, где КОИБов не было.
Единственное серьезное нарушение, зафиксированное на участке - попытка нарушить описанный в законе ход подсчета голосов, заменив его "своим собственным". Исправлено по моему настоянию, причем председатель и секретарь УИК пошли мне навстречу, не став настаивать на своей схеме. Поэтому фиксировать данное нарушение в протоколе я не стал.
Мелкие нарушения:
* Отсутствие выписки из законодательства на стенде
* Двое человек в кабинках для голосования (семейные пары)
* Не записывали паспортные данные людей, помогавших голосовать (людей я выбирал сам случайным образом)
* Небольшие расхождения (1-3 голоса) в подсчетах (наверняка ошибки подсчета)
* Не дали возможности расписаться на мешках с бюллетенями
Кажется, на этом всё.

В целом по Москве, однако, голосование было нечестным. Если оценить имеющийся массив статистики, то становится понятным, что мне просто повезло - стат. анализ практически однозначно показывает, что КОИБы подтасовывали число голосов избирателей. Реальный рейтинг ЕР по Москве - 46.85% голосов, официальные цифры (53.86%) за счет подтасовок с КОИБами и вбросов на ~10% участков завышены на 7%. Стат. анализ также показывает, что Единой России удалось притащить на выборы практически весь свой контингент избирателей - по моим оценкам, около 25% из 30% возможных населения Москвы. На участках, где не было нарушений, достоверно прослеживается (корреляция -0.65) обратная зависимость процента ЕР от числа проголосовавших, наглядно показывающая, что дома остались в основном сторонники оппозиционных партий. Вот так, ребята. Скажите спасибо себе родимым за то, что не пошли на "ничего не решающие выборы": если мои данные верны, то увеличение явки с 55% до 75% (на 20%) привело бы к тому, что ЕдРо набрало бы на выборах по Москве с учетом всех подтасовок около 32.45%. Эти Ваши 14.72% Вы вполне могли бы отдать тому же "Яблоку" и КПРФ - эти две партии выглядели бы тогда куда более достойно и куда более приближенно к реальной картине поддержки в обществе.

Готовьтесь к президентским выборам.

UPDATE: оказалось, что я не первый, кто пишу про корреляцию между явкой и выборами. Вот здесь можно найти описание более общего метода использования корреляции для поиска нарушений на выборах. altz_gamer провел подробный и весьма наглядный анализ по вышеизложенной схеме: анализ по УИК, анализ по ТИК. Там, правда, не делается никаких выводов (фальсификация это или просто результат успешной рекламной кампании ЕР), но всё и так очень наглядно

UPD2: идея витает в воздухе. Вот еще несколько независимых результатов подобных исследований: проверка на нормальность http://alexfroloff.livejournal.com/28076.html, корреляционный анализ: http://podmoskovnik.livejournal.com/1499.html. Отличную картину того, кого из оппозиции "гнобили" больше, а кого меньше можно посмотреть здесь: http://nesterovs.livejournal.com/13518.html

alexfroloff, altz_gamer, nesterovs, podmoskovnik, спасибо!

Похоже, у оппозиции неожиданно на руках оказался отличный козырь :). Сама по себе статистика и корреляционный анализ еще ничего не значат - мало ли какие факторы стоят за найденными закономерностями? Но против сравнения участков "с КОИБ" и "без КОИБ" в пределах одного и того же города, буквально соседних районов, возразить невозможно.
TODO: надо увеличить объем выборки. 3 района - это всё же довольно немного, надо бы собрать данные по нескольким десяткам ТИК из каждой группы (т.е. около 500 УИК с КОИБ и 500 с не-КОИБ)

UPDATE 3: ВАЖНО!

Я сегодня повозился с пересчетом данных, используя более подробную статистику... и понял, что крепко лажанулся. По участкам с КОИБ корреляция такая же, как в целом по г. Москве - слабая отрицательная:

корреляция по Северному округу (исправлено)
(данные по 250 УИК)

Большая корреляция в первом графике - результат ошибки при копировании данных (они копировались в стоблцы и были отсортированы по каждому из столбцов).
(Оставить комментарий) Страница 1 из 2 - [1] [2]
[User Picture Icon]
From:fat_crocodile
Date:Декабрь, 9, 2007 01:29 (UTC)
(Link)
Ммм.. А почему у тебя на участке КОИБы не врали?
[User Picture Icon]
From:_bigbrother_
Date:Декабрь, 9, 2007 06:39 (UTC)
(Link)
А из чего Вы сделали вывод, что они не врали?

Как я понял из отчёта о подсчёте голосов, собственно голоса учитывались только КОИБами. Комиссия считала бюллетени и отслеживала их судьбу - пересчёта голосов для сверки с КОИБами не было :).
[User Picture Icon]
From:reader59
Date:Декабрь, 9, 2007 06:31 (UTC)
(Link)
На прошлых выборах бюллетени, вроде, в конце обязательно извлекались из КОИБ и пересчитывались вручную. Сейчас не так?
[User Picture Icon]
From:0serg
Date:Декабрь, 9, 2007 08:58 (UTC)
(Link)
Сейчас уже не так. Ручной пересчет, если не ошибаюсь, теперь положен лишь на 5% случайным образом выбираемых участков. Для Москвы с её 3 тысячами УИК, из которых около 900 оборудовано КОИБ, пересчет достаточно было провести на 35 участках. Эти участки должны были произвольно определить все партии, учавствующие в выборах, т.е. каждая партия могла попросить о пересчете где-то на 3-4 участках. Но к сожалению, я пока не слышал ни об одном таком пересчете, ни об его результатах
[User Picture Icon]
From:_bigbrother_
Date:Декабрь, 9, 2007 06:47 (UTC)
(Link)
Так.

Правильно ли я понимаю, что самый сильный вывод - о том, что КОИБы врут - сделан на основании сопоставления статистики по участкам, где они есть и где их нет?
Первые показали сильную корреляцию процента поддержки ЕР и явки, в то время как вторые при учёте всех участков такой корреляции не показывали, а при отбрасывании "странных" показывали корреляцию слабее и обратную?

Зар-раза, статистику плохо знаю, вот и задаю такие вопросы :).
[User Picture Icon]
From:0serg
Date:Декабрь, 9, 2007 08:52 (UTC)
(Link)
Да, правильно. Корреляция на участках с КОИБ слишком высока для простого совпадения - стало быть, за ней что-то должно стоять; статистический анализ участков без КОИБ показывает, что там такой зависимости нет (и более того, скорее наблюдается обратная), а стало быть виновник корреляции - КОИБ, причем "врет" он в пользу ЕР, приписывая ей голоса.
[User Picture Icon]
From:asocio
Date:Декабрь, 9, 2007 07:18 (UTC)

Мда.

(Link)
А ведь не зря, получается, люди с таким подозрением относились к коибам и к прочим гас-выборам...

И ведь дальше-то, говорят, будет ещё больше автоматизации.
[User Picture Icon]
From:0serg
Date:Декабрь, 9, 2007 08:53 (UTC)

Re: Мда.

(Link)
Надо сопротивляться, пока всё еще не автоматизировано до конца. Пока оКОИБизировано сравнительно немного участков - даже по Москве всего 30%.
[User Picture Icon]
From:altz_gamer
Date:Декабрь, 9, 2007 14:37 (UTC)
(Link)
вот это круто! Отличный анализ и действительно сделанный по всем правилам, снимаю шляпу. Только пожалуйста, отметьте в UPD, что я предложил всё-таки две версии - как конспирологическую, так и менее радикальную политологическую (мол виновата мобилизация и все кто дополнительно пришёл - голосовали за тех, кто их "туда привёл"). Очень здорово.
[User Picture Icon]
From:0serg
Date:Декабрь, 9, 2007 21:54 (UTC)

Спасибо :)

(Link)
Добавил :)
[User Picture Icon]
From:alexfroloff
Date:Декабрь, 9, 2007 16:15 (UTC)
(Link)
Вот ещё опыт проверки на нормальность распределения:
http://alexfroloff.livejournal.com/28076.html
[User Picture Icon]
From:0serg
Date:Декабрь, 9, 2007 21:54 (UTC)
(Link)
Спасибо! Дописал в UPD
From:belan
Date:Декабрь, 9, 2007 19:21 (UTC)

Вопрос

(Link)
"Реальный рейтинг ЕР по Москве - 46.85% голосов, официальные цифры (53.86%) за счет подтасовок с КОИБами и вбросов на ~10% участков завышены на 7%." - при подсчете этих цифр явка была скорректирована? Ведь она тоже ниже объявленной.
[User Picture Icon]
From:0serg
Date:Декабрь, 9, 2007 21:27 (UTC)

Данные по явке не сравнивались

(Link)
М-м-м? Первая цифра - это оценка среднего значения рейтинга ЕР по 3м районам Москвы, вторая - это сводный результат по данным ЦИК.
Явку, в принципе, тоже можно посчитать...
From:belan
Date:Декабрь, 9, 2007 19:24 (UTC)

Еще вопрос

(Link)
Каковы реальные рейтинги других партий с учетом Вашей корректировки? "Высвободившиеся" за счет снижения рейтинга ЕР голоса распределились в прямой пропорции или как-то еще?
[User Picture Icon]
From:0serg
Date:Декабрь, 9, 2007 21:48 (UTC)

Re: Еще вопрос

(Link)
Не считал пока к сожалению. Примерную картину что и как подтасовывали видно здесь:
http://nesterovs.livejournal.com/13518.html
Кого-то давили сильнее, кого-то слабее.
Навскидку в качестве "нулевого приближения" по Москве, думаю, можно использовать данные голосования с моего участка (http://0serg.livejournal.com/103438.html) - явных подтасовок там не было. Точнее пока не скажу - надо считать.
From:(Anonymous)
Date:Декабрь, 9, 2007 19:58 (UTC)
(Link)
Если тема выборов интересна, можно взглянуть:
"Грязные ВЫБОРЫ-2007"
http://www.noputin.ru/viewtopic.php?t=8725&start=0
[User Picture Icon]
From:0serg
Date:Декабрь, 9, 2007 21:39 (UTC)
(Link)
Да, спасибо!
[User Picture Icon]
From:vreznikov
Date:Декабрь, 10, 2007 06:16 (UTC)
(Link)
В моем журнале есть файлы с результатами выборов по всем участкам.
[User Picture Icon]
From:kireev
Date:Декабрь, 10, 2007 07:28 (UTC)
(Link)
А это ничего, что для анализа Вы взяли рейоны Москвы, которые и на других выборах отличаются пониженной поддержкой ЕР: Сокольники и Измайлово относятся именно к таким районам. Ведь цифра 46,85% у Вас выведена именно из анализа данных по этим районам.
[User Picture Icon]
From:0serg
Date:Декабрь, 10, 2007 14:10 (UTC)
(Link)
Я скоро проведу более подробный анализ по всей Москве.
Но в цифрах отчета самое интересное - не набранные проценты, а корреляционные зависимости, для которых уровень поддержки (больше-меньше) не важен.
[User Picture Icon]
From:supermega
Date:Декабрь, 10, 2007 08:12 (UTC)
(Link)
Цитата из википедии (http://ru.wikipedia.org/wiki/%D0%92%D1%8B%D0%B1%D0%BE%D1%80%D1%8B_2007):

"...Результаты по Хабезской избирательной комиссии Карачаево-Черкесской республики, на которой не было ни одного наблюдателя [44]:

Внесено в списки избирателей: 17779 человек
Получено бюллетеней: 17779
Действительных бюллетеней: 17779
Из них за партию «Единая Россия»: 17779 человек..."


Зачем применять какие-то статистические методы анализа, если происходит даже такой гвоздец???
И чечня тоже показатель
[User Picture Icon]
From:0serg
Date:Декабрь, 10, 2007 14:13 (UTC)
(Link)
Нарушения на отдельных участках, увы, не являются достаточным поводом для отмены выборов.
А вот статистика, показывающая МАССОВЫЕ фальсификации - вполне себе является
[User Picture Icon]
From:grieg
Date:Декабрь, 10, 2007 09:07 (UTC)
(Link)
Респект!
[User Picture Icon]
From:gaz_v_pol
Date:Декабрь, 10, 2007 10:10 (UTC)
(Link)
Видимо, вы хорошо владете стастистическими программами... Если Вам не трудно, обсчитайте "контрольную группу" (выборы где-нибудь в Европе или США), пожалуйста. Предполагаю, что там корреляция между явкой и процентом за любую конкретную партию будет около 0. Это бы дало зримый аргумент при беседе с людьми, не очень понимающими математическую суть вопроса.

Еще один интересный вопрос - корреляция процента недействительных бюллетеней и явки по разным регионам РФ. Такой график был бы совсем независим от конкретных участников выборов - и, тем самым, может быть полезен в ситуации, когда в одном регионе идет фальсификация в пользу одной партии, а в другом - другой.
[User Picture Icon]
From:0serg
Date:Декабрь, 10, 2007 14:25 (UTC)
(Link)
Согласен. Вообще, хочется сделать более развернутую и понятную обычному человеку версию данного текста. Но пока на это не хватает времени :(.
[User Picture Icon]
From:kvazar
Date:Декабрь, 10, 2007 10:35 (UTC)
(Link)
я правильно понимаю, что вариант "предвыборные технологии" (когда при мнении 50/50 первая половина зазывается на выборы, а второй регулярно говорят "а что ходить, всё равно ничего не изменится" - и в результате сторонники ЕР приходят, а противники - сидят дома) Вы не рассматриваете?
[User Picture Icon]
From:0serg
Date:Декабрь, 10, 2007 14:18 (UTC)
(Link)
Рассматриваю. Собственно, обратная корреляционная зависимость процента голосов за ЕР с явкой говорит именно о том, что эта стратегия была успешно реализована.
(Оставить комментарий) Страница 1 из 2 - [1] [2]
Top of Page Разработано LiveJournal.com