?

Log in

Президент традиционно обращается к собранию, а мы традиционно проверим текст послания. Проверка прошлого года постом ниже http://purgenetik.livejournal.com/45547.html, результаты этого года https://clck.ru/ALRGu.
Сравнительный анализ показывает поразительное с̶к̶о̶т̶с̶т̶в̶о̶ сходство текстов как по SEO-анализу

так и по частотному анализу:


Подробности методик см. в предыдущем посте и на сайте проверки.

Тем самым, мессеж  понятен: России нужно развитие страны, говорил, должны экономике! Из года в год, нам нужно, и мы должны.

Как всегда, большое количество спама и воды.

Судя по результатам, спич-райтер не менялся.

Проверить уникальность не удалось, ибо система не позволяет при проверке отсечь тексты, выложенные после заданной даты, поэтому показываются результаты сравнения текста с себя самим, растиражированным на куче сайтов.

В общем, стабильность налицо!
Решил загрузить текст послания Президента в систему проверки текстов

Для начала, посмотрим результаты SEO-анализа



Процент заспамленности текста отражает количество поисковых ключевых слов в тексте. Чем больше в тексте ключевых слов, тем выше его заспамленность. В данном случае, заспамленность составляет почти 60% - граница, с которой начинается сильно оптимизированный или заспамленный ключевыми словами текст.
Процент водности текста отображает процент наличия в тексте стоп-слов, фразеологизмов, а также словесных оборотов, фраз, соединительных слов, являющихся не значимыми и не несущими смысловой нагрузки.  Согласно руководству показатель в диапазоне от 15% до 30% - превышенное содержание «воды» в тексте.
Таким образом, Владимир Владимирович балует нас сильно заспамленным текстом, в котором достаточно ощутимое количество водички.

Теперь результаты частотного анализа.




Таки образом, краткий месседж послания можно сформулировать так: [В этом] году России должны! [Для] развития страны нужно, необходимо [быть в] работе.

И вишенка на торт. Уникальность текста. Среди 100%-совпадений текста с самим собой видим вот эту интересную ссылочку:




Которая есть, ни что иное, как прошлогоднее послание Президента Фед. собранию! Таким образом, 45% прошлогоднего послания перекочевало в нынешнее. Собственно, это все, что нужно знать о послании. Таким образом, в данной шутке, оказывается, есть 45-% доля шутки (с на 45%):

Речь Владимира Владимировича была такой же конструктивной,как и предыдущие 11 его посланий. В нем можно почувствовать нежный бриз, шум моря и скрежет Чаек, лёгкие нотки 2 и 4 речей, теплый аромат речей 1, 3, игривость речи 7, а также интенсивное послевкусие речей 9 и 10.
Вот за что можно любить жуликов и воров, так это за постоянство! Санта-Барбара продолжается!

Поймали их за руку, ткнули носом в махинации. Они пообщали исправиться. И "исправились". Но вместо того, чтобы просто выключить систему накрутки голосов, они включили кеширование результатов, не позволяющее теперь контролировать ход голосования

Read more...Collapse )
3 декабря около 16:20 (в логах время GMT,  это -3 часа от Москвы) произошел "сбой" в работе счетчика - на несколько минут сбросили все показания, потом восстановились.

1417612816.712231000 12/03/14 13:20:16 89161
1417612882.714950000 12/03/14 13:21:22 1
1417612948.765700000 12/03/14 13:22:28 2
1417612961.958248000 12/03/14 13:22:41 89164

Очевидно, это связано с "регламентными" работами на сервере. Далее в 16:25 произошел последний прошальный сброс счетчика на 4 голоса:
Warning in <read_roi_log>: Line 3120: time='2014-12-03 13:25:22': 4 negative votes!

И после этого.... включилось кэширование результатов с длительностью 1 минута:

3dec_12

Рисунок 10. Картина событий по инициативе РОИ 9376, начиная с 3 декабря 16:30. Cлева: расстояние между двумя положительными (черный) и отрицательными (красным) срабатываниями счетчика голосований. Справа, это расстояние по оси X против величины, на которую прибавляется счетчик по оси Y.

Далее было объявлено о блокировки отрицательного голосования https://www.roi.ru/news/51/, хотя это уже для отвода глаза, с введением кэширования это уже не играет никакой роли.

Потому что внутри кэша теперь можно спокойно минусовать столько голосов, сколько надо, оставаясь при этом незамеченным.

Вот такое классическое исправление  жуликов - вводим механизм типа "черный ящик", в котором невозможно проследить, что происходит.

Полная статья - здесь:
http://purgenetik.livejournal.com/44696.html
Состоялась беседа по поводу накруток https://navalny.com/p/3986/
Смотрим распределение событий по времени в абсолютных цифрах

Рубеж 100 000 голосов достигнут: (GMT+3): 9 декабря 2014 19:54:59 - 100006 голосов
Счетчик отключен, голосование отстановлено (GMT+3): 9 декабря 2014 20:09:59 - 100092 голоса

Всем спасибо, все свободны!

Пояснение. Пропуски - это зависание скрипта. После следующего включения все накопленные за период простоя голоса добавляются в первый бин после простоя - отсюда большие пики.

Финальная картинка по динамике голосования - мощный финальный рывок:

votes_vs_time_9Dec
В относительных единицах до выключения "светового сигнала отзыва голосов":

neg_vs_pos_ratio


PS> Буду периодически обновлять картинки в этой записи по мере накопления новых данных. Подробный анализ ситуации смотри в предыдущем посте.

Накрутки РОИ: статья

Поскольку объем данных стал велик для записи в блоге, решил сверстать небольшую статью на тему (Disclaimer - много букв, графиков и прочей науки):

roi_art_v.0.3
https://drive.google.com/file/d/0B7ovM-50EaUZTko5Y1hHS3NaaW8/view?usp=sharing

Update 3/12/2004 13:40

Появилась статья по этой же теме на Хабре:
http://habrahabr.ru/post/244753/
Статистика за последние 45 часов, украдено 51.7 % поступивших голосов ЗА, или 437 из 845.

roi_9376

Исходные данные доступны по ссылке https://drive.google.com/file/d/0B7ovM-50EaUZWWkxdGxfNXBoTWs/view?usp=sharing

Предыдущии серии:
http://purgenetik.livejournal.com/44090.html
http://purgenetik.livejournal.com/43816.html
http://purgenetik.livejournal.com/43510.html (методика)
Да, как говорил мудрец, не садись с шулерами играть крапленными картами!

Показательный отрезок! С 29 ноября с 11 до 0:30 вечера (на картинке время по Гринвичу GMT,  Москва GMT+3) на РОИ были украдены ВСЕ голоса, поданные за инициативу. Из 34 голосов были украдены 33!!!

rate_9376_29nov_20-23

В такой ситуации трудно рассчитывать на результат, когда за 2 с половиной часа ты набираешь 34 голоса, а учитывается только один...

ДАЛЬШЕ - БОЛЬШЕ.

rate_9376_after_all

Что мы видим, за 4 часа (11-3 по Москве) за иницитиву пролосовали -20 граждан России. Это даже круче, чем полтора землекопа.

P.S.> Логи (исходные данные) доступны по адресу https://drive.google.com/file/d/0B7ovM-50EaUZWXdMTEY5M3Vad2M/view?usp=sharing
Предыдущий пост с информацией и методикой расчетов http://purgenetik.livejournal.com/43510.html

Обработана дополнительная статистика - результаты интересные - робот эволюционирует!

До полудня сегодня 29 ноября картина поедания голосов выглядела так:

rate_9376_before

Робот примитивно кусашал голоса каждые 6 или 12 мин. Последнее связано с тем, что при малом количестве голосов, видимо, алгоритм принимает решение не кусать голоса, потому возникает разница в 12 минут.

Отметим, что по этому отрезку режется 23% поступающих голов, или 8.3 голоса в час при общем скорости голосования - 35 голосов за.

Картина после полудня выглядит так:
rate_9376_after_1
Главное ноу-хау - появились откусывания вне отрезков, кратных 6 мин!  Похоже, программистов потыкали палкой, и они начали работать надосовершенствованием алгоритма. При этом отметим, что пики, кратные 6 минут, остаются. Что странно при новом алгоритме генерации вне 6 минутных интервалов. Возможно, мы наблюдаем промежуточный вариант, отладку робота и далее пики x*6минут изчезнут.

Кроме того, воровство серьезно усилилось: с 12-20 часов вечера 29 ноября было украдено 44%  процента голов, или 13 голосов в час при уровне голосвания ЗА 30 голосов в час.

А что же в контрольной группе, где принимают плацебо? А там - тишь да гладь, да божья благодать. Никакого тебе кеширования-меширования, никаких проблем за 11.5 часов:

rate_15227

Такая вот эволюция жуликов и воров, продолжаем следить за этим "увлекательным" аттракционом.

Цирк с клоунами пока никуда не уехал, он - на месте и готовит нам новую программу выступлений!

P.S.> Логи доступны по адресу https://drive.google.com/file/d/0B7ovM-50EaUZWXdMTEY5M3Vad2M/view?usp=sharing

Накрутки на ROI

Резюме: на РОИ осуществляется воровство голосов граждан в электронном правительстве. Конкретно, в субботу, 29 ноября 2014 года по инициативе https://www.roi.ru/9376 при помощи робота, автоматически включающегося каждые 6 мин, воровалось (списывалось с общего счетчика проголосовавших ЗА) в среднем 9 голосов в час, что составило 20% от общего количества голосов, поданных за инициативу.

Все детали проблемы описаны у Навального https://navalny.com/p/3976 , здесь выкладываю результаты собственных исследований.
Read more...Collapse )
Исходные данные: запустил скрипт, который автоматом каждые 2 секунды выкачивает число проголосовавших на страничке инициативы и, в случае изменения его (по сравнению с предыдущим) записывает в лог файл, который выглядит следующим образом (9376 - это инициатива Навального https://www.roi.ru/9376/):

[roi]$ head data/roi_9376.log
1417235561.061348000 11/29/14 04:32:41 87329
1417235709.484736000 11/29/14 04:35:09 87330
1417236603.864422000 11/29/14 04:50:03 87331
1417237833.630147000 11/29/14 05:10:33 87332
1417238401.132585000 11/29/14 05:20:01 87333
1417239394.042264000 11/29/14 05:36:34 87334
1417239580.834584000 11/29/14 05:39:40 87333  <---- Oops! I did it again!
1417240024.759801000 11/29/14 05:47:04 87334
1417240072.563116000 11/29/14 05:47:52 87335
Первые два поля - даты в юниксовом (сек.микросекунды) и человеческом виде, последняя - число проголосовавших ЗА. Действительно, в логе видны случаи уменьшения счетчика. Посмотрим статистику расстояний  между двумя последовательными видами событий: а) увеличения счетчика, б) уменьшения счетчика.  Ниже показана картинка процесса для инициативы Навального:

rate_9376
Черным цветом показано распределение разницы во времени между двумя последовательными положительными голосами. Как видим, что картина соответствует реальному процессу (нормальное голосование - случайный Пуассонов поток). Красным показана разница между двумя последовательными отрицательными голосами (голосование курильщика). А вот уменьшение счетчика происходит строго через каждые 6 минут (360 и 720 сек и т.д.), очевидно, что это делается искусственным образом. В итоге мы видим, что на данном промежутке времени робот-курильщик скрутил 20% голосов ЗА. Что и требовалось доказать. Так что если эта шарашка скручивает с самого начала, то 100 тыс. инициатива уже набрала.

По мере накопления статистики можно будет изучать процесс более детально - скрипт сбора данных работает.
Другие цифры по данной статистике (почти 10 часов):

Средняя скорость голосования ЗА (без учета скрутки): 42 в час.
Средняя скорость вороства голосов: 9 в час.

Для примера привожу голосование по другой (подозрительной) инициативе за то же время:

rate_15227
Но в этом случае негативных отсчетов нет вовсе, распределение положительных голосов пока трудно анализировать из-за небольшой статистики.

P.S.> Логи доступны по адресу https://drive.google.com/file/d/0B7ovM-50EaUZWXdMTEY5M3Vad2M/view?usp=sharing

Profile

purgenetik
Вася Чижиков

Latest Month

December 2016
S M T W T F S
    123
45678910
11121314151617
18192021222324
25262728293031

Tags

Syndicate

RSS Atom
Powered by LiveJournal.com
Designed by Lilia Ahner