Выборы и математика

можно ли на основании статистики надёжно обнаружить фальсификации, если таковые имеются?
 
1 2 3 4 5 6 7 19
+
+4
-
edit
 

О подозрительных закономерностях

Прочитав множество статей с анализом результатов выборов, о которых не стесняясь рапортует сайт ЦИК-а, мои коллеги из ОНСБ провели собственный анализ. Для … // lex-kravetski.livejournal.com
 

Москва:





Поделив модальную поддержку на модальную явку, получим альтернативные результаты выборов по Москве: Яблоко - 12,1%, КПРФ - 26,5%, ЕР - 26,5%, ЛДПР - 13,2%, СР - 18,8%, "Патриоты России" - 1,8%, "Правое Дело" - 1,1%. По официальным же данным получается: Яблоко - 8,7%, КПРФ - 19,7%, ЕР - 47,5%, ЛДПР - 9,6%, СР - 12,4%, "Патриоты России" - 1,4%, "Правое Дело" - 0,8%.

Но так как выборы у нас были честные и результат у них объективный, это всё, конечно же, какие-то глупости.
 



И еще:

 8.08.0
+
+2
-
edit
 

minchuk

координатор
★★★
Vale> Есть простой ответ...
Vale> Есть сложный ответ..
Vale> А мы будем пользоваться бритвой Оккама :)

И не только мы:

Может ли быть положительная корреляция между явкой и голосованием за одну партию? Практика показывает что это случается довольно редко. Если она и есть, то, как правило, слабая - сотые доли. Эта корреляция может быть вызвана региональными и демографическими неоднородностями, степенью политической конкуренции и "накалом борьбы" в разных регионах. Но сама корреляция голосования с явкой всегда намного слабее чем региональные различия в результатах голосования. Сам факт политической конкуренции ослабляет эту корреляцию (например, если одна партия ведёт активную агитацию за явку своих сторонников на отдельном участке, скорее всего другие партии тоже проявят активность в этом месте). Множество региональных и демографических факторов действует в разные стороны и размывает связь между явкой и результатами, так же ослабляя эту корреляцию.

В случае голосования за "Единую Россию" эта корреляция очень велика, фактический проближаясь к единице. Такая сильнейшая корреляция требует убедительного обьяснения. Достаточно простая и непротиворечивая гипотеза - о массовом "вбросе" и приписках голосов за ЕР, что одновременно увеличивает и явку и процент ЕР (но при том что вбросы очень неравномерно распределены по участкам и регионам) - хорошо обьясняет эту корреляцию. Ни одну другую гипотезу, которая могла бы обьяснить это явление так же убедительно и непротиворечиво, я придумать не могу.

О доказательствах двугорбого неверблюда и статистических соломинках

В этом посте я делаю попытку подвести итоги дискуссий о фальсификациях выборов с чисто количественной, статистической точки зрения. Я не буду утомлять читателей… // neznaika-nalune.livejournal.com
 
!"Ваше дело правое, мое дело Львиное..."
 8.08.0
+
-1 (+1/-2)
-
edit
 

yacc

старожил
★★☆
minchuk> Может ли быть положительная корреляция между явкой и голосованием за одну партию? Практика показывает что это случается довольно редко. Если она и есть, то, как правило, слабая - сотые доли. Эта корреляция может быть вызвана региональными и демографическими неоднородностями, степенью политической конкуренции и "накалом борьбы" в разных регионах.
Хотелось бы посмотреть, где это исследовано и расписано :)
 3.6.243.6.24

Fakir

BlueSkyDreamer
★★★★☆
minchuk> Нет. У тебя (как минимум) два "события", причем взаимосвязанные и зависимые друг от друга.

Это ПОТОМ. СНАЧАЛА явка. Во-первых
ЕСЛИ удаётся достаточно надёжно доказать, что не-квазигауссова явка не возможна без вбросов/приписок - то УЖЕ можно быть почти уверенным в их наличии.
Если не удаётся - идём дальше и работаем с корреляциями разными способами.

Это НОРМАЛЬНЫЙ метод ведения научного исследования - начиная от простого (простейшей модели, с минимумом вовлечённых факторов) с последующим поэтапным усложнением.

Блин, обидно, что такую очевиднейшую ерунду приходится разжёвывать...
 3.6.243.6.24

  • Fakir [09.12.2011 14:19]: Предупреждение пользователю: russo#08.12.11 22:40
+
-
edit
 

iodaruk

аксакал

☠☠☠☠
А никто не смотрел-если отбросить вбросы и кражу голосов-Яблоко 7% набирает?

Альянс Яблоко-КПРФ за ради большинсва в думе-это чтото с чемто :)
 15.0.874.12115.0.874.121

Fakir

BlueSkyDreamer
★★★★☆
Mishka> Тогда уж надо рассматривать и по географическому положению, а так же по размерам участка (количеству голосов, которые прикреплены к ним), а так же по количеству открепительных талонов, которые на этом участке внезапно появились.

Да, в идеале да. На следующем этапе.

Mishka> Есть эффект системы в делах анализа данных, когда вместе сведённые данные дают лучшую и принципиально новую картинку.

...или перегружают входы до полной неразберихи.
 3.6.243.6.24
+
-1
-
edit
 

Fakir

BlueSkyDreamer
★★★★☆
Fakir>> В зависимости от доли участков, пользующихся тем или иным методом стимуляции явки - возможна, ИМХО, и отчётливо ясный разброс по явкам, с чёткими отклонениями.
Mishka> Вот объясни, как ты видишь такую работу, если только не пресловутое — кто не проголосует, как я сказал — уволю!

Миша, ну сколько можно про "проголосовать как велено"?
На это отвечаю в последний раз, бо надоело: механизма контроля такого нет, в отличие от механизма контроля явки.

ЗАСТАВИТЬ (принудить, убедить, купить) просто ПРИДТИ на избирательный участок - можно, заставить проголосовать за конкретного кандидата - практически нельзя.

ЕСЛИ местные главноуговаривающие, скажем, "заставили" придти на выборы чисто уговорами - вполне можно предположить, что и за конкретную партию им удалось бы сагитировать чисто уговорами же.


Fakir>> Давай не будем перепрыгивать через этап. Сначала как-то договоримся насчёт распределения по явке.
Mishka> Дык, по явке уже графики приводили.

Хотя бы договориться до коллективного согласия: возможно ли отклонение от квазигаусса без вбросов, или нет.
 3.6.243.6.24
+
-2
-
edit
 

Fakir

BlueSkyDreamer
★★★★☆
До кучи просто чтобы было:


Каков реальный масштаб фальсификаций? Сравнение 3-х методов


Сегодня мне на почту уважаемый мной человек прислал вордовский файл, в который скопирована информация из блога Леонида Каганова : Данные взяты с сайта ЦИК. Из …

// maxgorbunov.livejournal.com
 


Методика сомнительна, но подход интересен.

Действительно, можно ведь отбросить наиболее подозрительные пики и тяжёлый хвост - тем более что они отвечают за довольно малый процент голосов.

Как можно работать с оставшимся сглаженным распределением? Что можно выжать из него, как-то убедиться в наличии/отсутствии в нём подделок?


Еще, говорят, была какая-то статья Чурова и Ко про статистику выборов 2007-го, что ли - но по ссылке сейчас оказалась недоступна.
 3.6.243.6.24

yacc

старожил
★★☆
Fakir> заставить проголосовать за конкретного кандидата - практически нельзя.
Эт почему? :)
 3.6.243.6.24
+
+1
-
edit
 

Barbarossa

Любитель тунисских тётков
★★★★
Fakir> Миша, ну сколько можно про "проголосовать как велено"?
Фотофиксация на мобилу джял отчета..

Или как вариант вынос заполненного бюллетеня за участок, показ галочки смотрящему... и потом заброс.
 
+
-3
-
edit
 

Fakir

BlueSkyDreamer
★★★★☆
Вот уж такой беспредел В МАССОВОМ порядке (более 10%) хрен спрячешь. Поэтому за скобки выносим - технология не массовая.
 3.6.243.6.24
+
+1 (+2/-1)
-
edit
 

Vale

Сальсолёт

Fakir> ЗАСТАВИТЬ (принудить, убедить, купить) просто ПРИДТИ на избирательный участок - можно, заставить проголосовать за конкретного кандидата - практически нельзя.

Требуется доказать :) Я вот считаю что практически можно :)
"Не следуй за большинством на зло, и не решай тяжбы, отступая по большинству от правды" (Исх. 23:2)  8.0.18.0.1
+
+1 (+2/-1)
-
edit
 
Fakir> ЕСЛИ удаётся достаточно надёжно доказать, что не-квазигауссова явка не возможна без вбросов/приписок - то УЖЕ можно быть почти уверенным в их наличии.

Да епрст. От тебя уж не ожидал.

Разумеется не-квазигауссова явка возможна. Вопрос тут в вероятностях. Скажем вероятность того что явка за ЕР выглядят так как она выглядит сейчас весьма мала. Это, вкупе с многочисленными зафиксированными нарушениями, и позволяет нам предположить что самое вероятное объяснение тут — фальсификации и использование админ. ресурса.
 8.08.0
iodaruk> А никто не смотрел-если отбросить вбросы и кражу голосов-Яблоко 7% набирает?

Вроде бы все равно нет.
 8.08.0
Fakir> заставить проголосовать за конкретного кандидата - практически нельзя.

Наивный. Сам же выше писал про "принеси фотографию бюллетеня начальнику". Да и в топике про выборы пробегала фотография из Чечне — прямо рядом с урной стоит неулыбчивий бородач с АК, и внимательно смотрит на опускаемый в нее бюллетень.

Fakir> Методика сомнительна

Что именно сомнительно, и почему? Конкретно.

Fakir> Действительно, можно ведь отбросить наиболее подозрительные пики и тяжёлый хвост

С чего ты взял что фальсификации и админ. ресурс наличествуют только на пиках? Пики — это отличная индикация того что иррегулярности наличествуют, но из них никак нельзя сделать вывод что на "некрасивых % явки" вбросов и админ. давления не было.

И откуда именно предлагаешь рубить "тяжелый хвост"? С какого процента явки?

Fakir> была какая-то статья Чурова и Ко

Хех, и на какую тему? "Хочешь стать волшебником — спроси меня как?" :)
 8.08.0
+
+2
-
edit
 

Balancer

администратор
★★★★★
russo> И откуда именно предлагаешь рубить "тяжелый хвост"? С какого процента явки?

Вообще, первичный анализ начинался с оценки роста доли голосов за ЕР по мере роста посещаемости. Очевидно, что по мере роста числа "вброшенных" бюллетеней, растёт и доля явки. Соответственно, в целом, чем ниже явка, тем ближе данные к достоверным. Анализ соответствующей зависимости показывает высокую степень корреляции. Так что реальная доля голосов за все партии оценивается по левому краю этого распределения, пока доля голосов за ЕР не начинает аномально расти, а у других партий — падать.

Тогда по Москве у ЕР получается что-то около 20..25%. По стране в целом — 30..35%

Это достаточно близко к оценкам, полученным иными способами.
 
+
-
edit
 

bashmak

аксакал

Balancer> Так что реальная доля голосов за все партии оценивается по левому краю этого распределения, пока доля голосов за ЕР не начинает аномально расти, а у других партий — падать.

лучше смотреть % не от проголосовавших, а от списочного состава, как vladislav_01 - Выборы в Госдуму в Москве. Несколько графиков. тогда для других партий получается константа - проще сравнивать. Соответвенно и метод выбрасывания добавленных голосов простой - %от проголосовавших и % от списочного состава должны иметь одинаковую зависимость. Тогда ничего рубить не надо.





 
+
0 (+1/-1)
-
edit
 

Vale

Сальсолёт

Есть азбучная истина - изломы на кривой должны иметь какое-то объяснение.

Если Факир категорически не желает видеть ИЗЛОМЫ на кривых ЕР, СР, КПРФ, Яблоко без посторонней помощи - нарисуйте ему производные, что ли. Или давайте скинемся на визит к окулисту.
"Не следуй за большинством на зло, и не решай тяжбы, отступая по большинству от правды" (Исх. 23:2)  8.08.0
Это сообщение редактировалось 09.12.2011 в 21:54

Fakir

BlueSkyDreamer
★★★★☆
minchuk> neznaika_nalune: О доказательствах двугорбого неверблюда и статистических соломинках

И комментарии также.

- как-то арифметика не сходится. 50-[10-15] = 40-35. откуда "еще ниже"?
ну и я видел оценку не в 10-15, а примерно в 5-6.

- Такие видел тоже, да. Но просто на интуитивном уровне, из данных что видел, наиболее достоверно выглядит не менее 10% приписок.
 


У одних одна интуиция, у других другая...
Метод нужен чёткий и корректный, с оценками точности и т.п. А не одна интуиция против другой.
 3.6.243.6.24

Fakir

BlueSkyDreamer
★★★★☆
Fakir>> заставить проголосовать за конкретного кандидата - практически нельзя.
russo> Наивный. Сам же выше писал про "принеси фотографию бюллетеня начальнику".

И такого - на десять миллионов голосов? Ты сам в это веришь?
Или троллишь?

Fakir>> Действительно, можно ведь отбросить наиболее подозрительные пики и тяжёлый хвост
russo> С чего ты взял что фальсификации и админ. ресурс наличествуют только на пиках? П

Да читай ты блин целиком, а не вырывая фразы :mad:

"Как можно работать с оставшимся сглаженным распределением? Что можно выжать из него, как-то убедиться в наличии/отсутствии в нём подделок?"

В последний раз, медленно: ЕСЛИ мы откинем наиболее подозрительные пики и т.п. - можно ли быть уверенным, что в оставшемся сглаженном распределении есть/нет подделки? И как можно оценить их возможную величину?

Вопрос понятен?
 3.6.243.6.24

Fakir

BlueSkyDreamer
★★★★☆
russo> Разумеется не-квазигауссова явка возможна. Вопрос тут в вероятностях. Скажем вероятность того что явка за ЕР выглядят так как она выглядит сейчас весьма мала.

Почему? С учётом принудительной явки, тупо явки при свободном волеизъявлении?
 3.6.243.6.24
+
+1
-
edit
 
russo>> Скажем вероятность того что явка за ЕР выглядят так как она выглядит сейчас весьма мала.
Fakir> Почему?

Потому что это противоречит логике

Сомневающиеся в фальсификациях ставили ряд вопросов. Например, "а почему распределение голосов должно быть нормальным"? Строго говоря, не обязано быть нормальным. Более того, если бы оно выглядело очень гладкой гауссианой, это так же вызывало подозрение. Распределение является суммой голосований по множеству регионов, между которыми могут быть существенные различия. Случайные отклонения вокруг любого достаточно однородного процесса по законам статистики неизбежно ведут к распределению близкому к нормальному. Когда общий результат - сумма многих процессов с различными показателями среднего и дисперсии, этот результат будет более сложным, но по форме всё равно напоминающим размытое облако, хоть и отличающееся от "колоколообразной" формы.

Но когда оно отличается очень сильно, принципиально, в частности имеет вид двух чётко выраженных максимумов, между которыми статистическая плотность гораздо ниже - эта ситуация требует специального обьяснения. Ведь, несмотря на региональные особенности, в большой и неоднородной стране множество факторов в целом должны сглаживать эти пики и уменьшать "провал" между максимумами. Границы округов и участков часто не совпадают с естественными социально-демографическими градиентами. В особенности трудно обьяснить очень большие различия на многих соседних участках, с близкими социально-демографическими характеристиками. Наиболее простым и непротиворечивым обьяснением этой бимодальности распределения голосов за ЕР, является предположение о том что на некоторых участках искажения были минмальны, а на других - очень велики; в зависимости от того допустила ли избирательная комиссия эти фальсификации или нет. Я не вижу ни одного альтернативного обьяснения такой бимодальности, которое бы проходило простые статистические тесты.
 


И противоречит результатам других выборов, тех которые можно в высокой степенью вероятности предполагать в значительной степени честными. См. графики в статье эсквайра, ну или копайся в инете. Например первое поапвшееся, президентские выборы в Минесотте



Да что там — даже в российских выборах у других партий распределение по явке гауссово.

Fakir> С учётом принудительной явки

Если принудительная явка состоит в завлечении ВСЕХ избирателей и их свободном волеизьявлении — при более высокой явке процент проголосовавших за ту или иную партию не должен меняться значительно. Это снова логика.

Когда же мы наблюдаем что чем высокая явка в значительной степени коррелирует с увеличением доли голосов за ЕР, и в силу того что нам известно о массе зарегистрированных случаев фальсификаций и административного давления — то наиболее вероятная версия тут — фальсификации и административное давление со стороны партии власти.

Fakir>>> заставить проголосовать за конкретного кандидата - практически нельзя.
russo>> Наивный. Сам же выше писал про "принеси фотографию бюллетеня начальнику".
Fakir> И такого - на десять миллионов голосов? Или троллишь?

Троллишь, а точнее врешь, ты — где я что-то подобное говорил?

Завышенный результат ЕР получился из-за комплекса причин, и административное давление с контроллем заполнения бюллетеня — лишь одна из них.

Fakir> Fakir>> Действительно, можно ведь отбросить наиболее подозрительные пики и тяжёлый хвост
russo>> С чего ты взял что фальсификации и админ. ресурс наличествуют только на пиках?
Fakir> Да читай ты блин целиком, а не вырывая фразы :mad:

Я читаю целиком. Ты предложил отбросить одни лишь пики, как некий горе-аналитег с которым недавно носился ttt. Это — негодный подход, бо очевидно что фальсификации и админ. давление скорее всего оказали влияния и на данные "между пиками" тоже.

Fakir> Как можно работать с оставшимся сглаженным распределением?

Не, а что интересует-то? Как нормализовать кривые, получить % аномальных голосов, и проч.? Это все расписано у блоггеров ссылок на которых в этом топике хватает. Ты их читал?

Fakir> В последний раз, медленно: ЕСЛИ мы откинем наиболее подозрительные пики и т.п. - можно ли быть уверенным, что в оставшемся сглаженном распределении есть/нет подделки?

Нет конечно. Наиболее вероятная версия тут то что в оставшемся распределении фальсификации/административный ресурс будут, но уверенным быть ни в чем нельзя. Это же статистика.
 8.08.0
+
-1
-
edit
 

Fakir

BlueSkyDreamer
★★★★☆
russo>>> Скажем вероятность того что явка за ЕР выглядят так как она выглядит сейчас весьма мала.
Fakir>> Почему?
russo> Потому что это противоречит логике
Fakir>> С учётом принудительной явки
russo> Если принудительная явка состоит в завлечении ВСЕХ избирателей и их свободном волеизьявлении — при более высокой явке процент проголосовавших за ту или иную партию не должен меняться значительно. Это снова логика.

:bangdesk:
Ты в состоянии не перепрыгивать?

Fakir>> И такого - на десять миллионов голосов? Или троллишь?
russo> Троллишь, а точнее врешь, ты — где я что-то подобное говорил?

Если ты такого не говорил - то значит, прямое принуждение с контролем статистически не значимо, ибо не могло дать не то что 10%, но и 1% вряд ли.
Так нафейхоа о нём тут говорить?!

russo> Я читаю целиком. Ты предложил отбросить одни лишь пики, как некий горе-аналитег с которым недавно носился ttt. Это — негодный подход, бо очевидно что фальсификации и админ. давление скорее всего оказали влияния и на данные "между пиками" тоже.

Твою налево!!! Я не предлагаю отбросить ТОЛЬКО пики!!!
Читай вопрос. ПОЛНОСТЬЮ.

russo> Нет конечно. Наиболее вероятная версия тут то что в оставшемся распределении фальсификации/административный ресурс будут, но уверенным быть ни в чем нельзя. Это же статистика.

Так и как тогда оценивать то, что там было?

Меня интересует в первую очередь: как определить, было ли подделано 5% или 15%. Можно ли это вообще определить сколько-нибудь достоверно.

Ну вот пики - они с довольно высокой вероятностью подделаны. Но тем не менее за небольшое кол-во голосов отвечают.
 3.6.243.6.24

Fakir

BlueSkyDreamer
★★★★☆


Немного оптимизма


Вот потратил полчаса и посмотрел  данные по району "Теплый стан" . По горизонтальной оси - процент "явки", по вертикальной - процент голосов за ЕР. Для …

// macroevolution.livejournal.com
 


Мужик пытается что-то прикидывать по участкам Тёплого Стана.

Его мнение:
И это - один из самых приличных районов. Несмотря на статистически странное поведение четверти участков, ЕР набрала всего 29.7%. Без жульничества вышло бы где-то 22%.
 
 3.6.243.6.24
+
+1 (+2/-1)
-
edit
 

Vale

Сальсолёт

Fakir> Меня интересует в первую очередь: как определить, было ли подделано 5% или 15%. Можно ли это вообще определить сколько-нибудь достоверно.

Можно. Но некоторые не способны понять объяснения. Они начинают отрицать закон больших чисел к примеру. Пытаются опровергнуть случайность распределения голосов по участкам. Изобретают какие-то непонятные сложные связи между явкой и голосованием - на пустом месте.

Для тех, кто считает, что в России - народ на избирательном участке голосует, как и поляки/англичане/мексиканцы, а не по каким-то своим, особым законам, все просто.

Вот два варианта.

1. Можно взять выборку по участкам, где ЗАВЕДОМО не было нарушений. Посчитать статистику. Сравнить с экзит поллами. Сравнить с официальными данными. Что не совпадает - то фальсификация.

2. Сравнить кривые распределения. Ну как в Троицком варианте. Расписывать - лень.
"Не следуй за большинством на зло, и не решай тяжбы, отступая по большинству от правды" (Исх. 23:2)  8.08.0
Это сообщение редактировалось 09.12.2011 в 23:47
1 2 3 4 5 6 7 19

в начало страницы | новое
 
Поиск
Настройки
Твиттер сайта
Статистика
Рейтинг@Mail.ru