1. >
  2. Блог >
  3. Урсин

О принципе Бонферрони и поиске шпионов

28 апреля 2021 15:20:19   589 7 +1.87 / 45
Подозрения и доказательства виновности российских граждан строятся на результатах обработки так называемых больших данных о поездках в Европу. Давно известен один эффект в статистике - проблема множественных сравнений, неучет которого приводит к недостоверным выводам. Коротко говоря, это проблема завышения статистической значимости результатов статистических тестов, возникающая при выполнении большого числа тестов.
Например, абстрактная обезьяна, ударяя случайным образом по клавишам в течение долгого времени, рано или поздно напечатает любую наперёд заданную фразу. Таким образом, поиск осмысленных фраз в большом наборе случайных знаков закончится успехом и может быть сделан ложный вывод о грамотности обезьяны. Вот краткое изложение известного из литературы по большим данным примера по теме разговора.
Поиск террористов. Допустим, полиция полагает, что где-то действуют «злоумышленники» и что они периодически встречаются в гостиницах, чтобы спланировать свой злой умысел. Если искать пары людей, которые несколько раз случайно пересекались в гостиницах в течении нескольких лет, то в разряд подозрительных попадет примерно четверть миллиона жителей планеты. Огромные возможности для выбора подозреваемых и подгонке под версию у нечистоплотных полицейских.
Да очень много русских бывает в Европе. Да, они оказываются рядом с местами, где что то произошло. Так что выбор у аналитиков западных спецслужб огромный.
Чтобы избежать трактовки случайных фактов как реальных, нужно воспользоваться следующим "принципом Бонферрони". Вычислите ожидаемое число искомых событий в предположении, что данные случайны. Если это число существенно больше количества ожидаемых реальных событий, то следует полагать, что почти все найденные события фиктивные, т. е. являются статистическими артефактами, а не свидетельством в пользу того, что вы ищете.
Кто-нибудь доведите уже эти соображения до европейских аналитиков.
Опубликовано в: Большой передел мира
  • +1.87 / 45
Поделиться в социальных сетях:

КОММЕНТАРИИ (7)

  Urri2
  • Удалено
  • +0.33 / 7
Урсин
 
Россия
65 лет
Слушатель
Карма: +22.32
Регистрация: 18.09.2017
Сообщений: 47
Читатели: 0
Опасаюсь,если им пересказать Ваш текст, они вежливо поинтересуются, с кем вы всё это время разговаривали
Хотел как лучше и старался излагать максимально популярно. А получилось как всегда.
+1.53 / 23
alb@tros
 
Россия
Свердловск-Екатеринбург
Специалист
Карма: +8,511.79
Регистрация: 22.09.2014
Сообщений: 7,303
Читатели: 5
Хотел как лучше и старался излагать максимально популярно. А получилось как всегда.
Было интересно. Пишите ещё. Я без сарказма, серьезно.
На небе Бог, а на земле Россия -
Друзьям мила и ворогу страшна,
Святой простор и в нём под небом синим
Непобедимая душа!
+0.90 / 11
  Urri2
  • Удалено
  • +0.00 / 0
__Alex_loki_
 
Россия
43 года
Слушатель
Карма: +548.42
Регистрация: 11.08.2010
Сообщений: 2,862
Читатели: 0
Скрытый текст
Кто-нибудь доведите уже эти соображения до европейских аналитиков.
у них альтернативная математика же ! Подмигивающий
"что-бы получить правильный ответ надо задать правильный вопрос." - народная мудрость .
"что-бы задать правильный вопрос надо знать большую часть ответа." - Роберт Шекли "ответчик".
+0.00 / 0
Урсин
 
Россия
65 лет
Слушатель
Карма: +22.32
Регистрация: 18.09.2017
Сообщений: 47
Читатели: 0
у них альтернативная математика же ! Подмигивающий
Это действительно страшная беда: при стремительном развитии технологий Data Mining, Big Data, AI, Machine Learning ... утратить способности и навыки научного анализа результатов этих технологий. Это страшнее самого дикого средневековья.
Почтальонов 20 лет по ошибке сажали в тюрьму из-за «кривого» ПО
Отредактировано: Урсин - 28 апреля 2021 18:28:38
+0.55 / 13
bb1788
 
Слушатель
Карма: +2,818.72
Регистрация: 28.11.2017
Сообщений: 6,054
Читатели: 7
Скрытый текст
Допустим, полиция полагает, что где-то действуют «злоумышленники» и что они периодически встречаются в гостиницах, чтобы спланировать свой злой умысел. Если искать пары людей, которые несколько раз случайно пересекались в гостиницах в течении нескольких лет,
Скрытый текст
"принципом Бонферрони". Вычислите ожидаемое число искомых событий в предположении, что данные случайны. Если это число существенно больше количества ожидаемых реальных событий,
Скрытый текст

Встреча "террористов" не является случайным событием.
Анализировать данные в вероятностном подходе некорректно.
Бонферрони здесь не поможет, т.к. количество встреч "террористов" в данной гостинице ровно один штук при любом анализе. Хоть вычисляй, хоть не вычисляй.

Глупость применения вероятностного подхода к неслучайным событиям была ярко продемонстрирована, например, хуцпой об отклонениях от "статистики" в количестве голосований за одного кандидата.
Мне интересно, какую модель "случайных" событий выбирали "аналитики"?
Типа избиратель приходит на участок, его ...чат молотком по голове, он падает рожей на стол с бюллетенями. В какой квадратик бюллетеня уткнётся нос, за того и проголосовал. При этом его держат за руки, чтоб не испоганил данные эксперимента "случайно" упёршись в бюллетени руками.
Отредактировано: bb1788 - 29 апреля 2021 08:33:40
+0.29 / 3