Коронавирус и другие пандемии.
6,842,029 32,270
 

  DeC ( Слушатель )
02 май 2020 21:06:25

Нью-Йорк

новая дискуссия Дискуссия  641

Власти выявили у 19,9% жителей города Нью-Йорк антитела к коронавирусу, заявил на пресс-конференции губернатор штата Нью-Йорк Эндрю Куомо, ссылаясь на данные 15 тысяч тестов.

Непонимающий
  • +0.19 / 12
  • АУ
ОТВЕТЫ (22)
 
 
  Nobody ( Слушатель )
02 май 2020 21:25:32

Ну да. В NY грубо 10 миллионов населения, тестов сделали меньше миллиона, а по 15 тысячам прикинули  что антитела аж у 2 миллионов.
С другой стороны - а че бы не прикинуть и не опубликовать.
  • +0.07 / 5
  • АУ
 
 
  NavyGator ( Слушатель )
02 май 2020 21:39:14

Если выборка является репрезентативной - то они имели право так говорить.15 тысяч - достаточно большая выборка.
  • +0.34 / 19
  • АУ
 
 
 
  Cheen ( Слушатель )
02 май 2020 22:41:28

Можно сравнить с Москвой, в которой при сравнимой численности 250тыс зараженных предполагают. С поправкой на разницу в летальности.
  • -0.02 / 1
  • АУ
 
 
 
  Nobody ( Слушатель )
02 май 2020 22:58:02

Именно. А самое интересное и не сказали. Кого, когда и где.
  • +0.05 / 2
  • АУ
 
 
 
 
  rat1111 ( Слушатель )
03 май 2020 00:15:26

И не скажут. Параметры выборки - самый главный и самый люто охраняемый секрет в этом бизнесе. Как дочь социолога говорю
  • +0.32 / 16
  • АУ
 
 
 
  __Alex_loki_ ( Слушатель )
03 май 2020 01:56:19

если выборка не случайна , то её место в мусорном ведре .
  • +0.04 / 4
  • АУ
 
 
 
 
  Uncle Ben ( Слушатель )
03 май 2020 08:27:31

Где-то так, но... Данные будут не достоверны, но достоверность - это из шкалы от 0 до 100%. Все же какую-то информацию неслучайная выборка несет. Например, вся эта пандемия была объявлена по неслучайной выборке. Получить правильные выводы из них сложнее, не на все вопросы можно ответить, но "не имея гербовой...". Но очень похоже, что в навалившейся работе этому долго не придавали значения.
  • +0.00 / 0
  • АУ
 
 
 
  Uncle Ben ( Слушатель )
03 май 2020 08:16:05

Выбрать из почти миллионной нерепрезентативной выборки репрезентативную - задача нетривиальная. Поэтому недели три назад было заявлено о начале выборочного обследования. Случайная выборка объемом около 1000 в многомиллионном городе уже даст результат с хорошей точностью и позволит спланировать другие выборки по разным разрезам населения, и о начале такого обследования в NY было объявлено недели три назад. По такому же пути идет и Москва. Полные результаты публиковать нет смысла, поскольку ситуация пока быстро меняется и зависит от локализаци, но отдельные параметры уже вышли на свое плато.
  • +0.09 / 3
  • АУ
 
 
 
 
  GrinF ( Слушатель )
03 май 2020 19:53:14

И вчем нетривиальность. Выборка по НЙ в несколько десятков раз превышает минимальный размер представительной выборки...пройтись по этой выборке слуйчайным семплером и получишь выборку более менее представительную...за ситуацией в НЙ не наблюдал возможно там есть свои инфекционные бараки и нужно разные веса присвоить разным районам...отдельный нюанес если нужно исследования по возрасту, полу, штаммам-тогда нужно объем выборки увеличивать но все равно миллион человек для 10, которые тестировались хоть и несистемно но точно случайным образом по всем районам это суперрепрезентативно
  • +0.03 / 1
  • АУ
 
 
 
 
 
  Explorer-2000 ( Слушатель )
03 май 2020 20:13:17

Тестировались как раз те кто не болел (ну или не знал что болел), и таки да они дают результаты по полу, возрасту, расе, это же СШАПодмигивающий
  • -0.02 / 2
  • АУ
 
 
 
 
 
  Uncle Ben ( Слушатель )
03 май 2020 20:30:10

Уже первичная выборка не отражает ситуацию - она хоть и большая, но в нее попали, в основном, отобранные по симптомам - при том потоке было не до выборочной проверки и даже не до контактных и группам риска, как они понимались в тот момент. Отбор происходил на протяжении нескольких инкубационных периодов и в результате принимаемых оргмер менялась ситуация и вся эта каша собралась в этом миллионе.  Случайный выбор из него сохранит эту искаженную картину. Даже проверка всех желающих не даст картины заболеваемости. Чтобы получить реальную картину не нужны миллионные выборки, тем более, что картина меняется и данные стареют, да и не очень понятно, зачем тестировать бессимптомных без дополнительных показаний, типа контактов - всех не выловишь и все равно надо рвать контакты. Но надо иметь оценку их количества и отслеживать это изменение во времени. Другого пути, как периодические случайные выборки, матстатистика не предлагает - это и проще и результаты надежнее.
  • +0.00 / 0
  • АУ
 
 
 
 
 
 
  Explorer-2000 ( Слушатель )
03 май 2020 20:37:34

Ну так это и делается
  • +0.00 / 0
  • АУ
 
 
 
 
 
 
 
  Uncle Ben ( Слушатель )
03 май 2020 20:55:44

Я отвечал на вопрос, почему не стоит ориентироваться на проверенный миллион. А то, что так и делается, писал в исходном посте, его вызвавшем. Так что у нас разногласия в этом нет.
  • +0.00 / 0
  • АУ
 
 
  Explorer-2000 ( Слушатель )
02 май 2020 23:30:18

А в чём проблема тоНепонимающий если выборка правильно отражает всё население то почему нетНепонимающий
  • +0.02 / 1
  • АУ
 
 
 
  rat1111 ( Слушатель )
03 май 2020 00:30:41

В принципе 15К -позволяет в городе многомиллионнике получить достоверные статистические результаты.
Однако есть два но:
- Нью-Йорк весьма неоднородная с социологической т.з. территория
- в данном случае непонятно как составить выборку, которая будет "правильно отражать все население"
Не... тот же факторный анализ может что-то дать, но это достаточно сложно и не быстро. На одной выборке в 15К я бы рискнул крутануть только первый проход для определения параметров формирования выборки.
  • +0.38 / 20
  • АУ
 
 
 
 
  Explorer-2000 ( Слушатель )
03 май 2020 00:45:16

Ну так это уже третье исследование как я понимаю. В США вообще имеются подробные статистические данные во многих областях так что как правильно составить выборку они тоже знают. Подобные исследования во всем штатам идут.
  • +0.03 / 2
  • АУ
 
 
 
 
 
  rat1111 ( Слушатель )
03 май 2020 01:08:04

Я не сомневаюсь, что мудрые эльфы валинора мудры и знают все
Тем не менее - открою вам большой секрет - параметры формирования выборки очень сильно зависят от предмета исследования. Например в выборку на предмет выяснения "на какую наживку вы ловите плотву на весенней Ладоге" не имеет смысла включать тех кто ловит плотву на весенней Рыбинке и тех кто вообще плотву не ловит.
Впрочем, даже в "общих вопросах" типа выборов президента США американские статистики умудрялись неоднократно облажаться. Ладно, история 1936 года, вошедшая во все учебники по социологии, дело давнее. Но Трампа то проспали - вот вот
  • +0.39 / 21
  • АУ
 
 
 
 
 
 
  Explorer-2000 ( Слушатель )
03 май 2020 03:09:00

Ну.. Выборы Трампа это большая политика, здесь же локальное исследование в одном штате, где администрация просто интересуется что будет если они отменят карантин.

PS То что выберут Трампа было очевидно без всякой математики, просто руководство США долго игнорировало объективные процессы, тут никакая статистика не поможет
  • -0.04 / 3
  • АУ
 
 
 
 
 
 
 
  bb1788 ( Слушатель )
03 май 2020 09:01:52
Сообщение удалено
bb1788
28 ноя 2021 17:20:12
Отредактировано: bb1788 - 28 ноя 2021 17:20:12

  • +0.02
 
 
 
 
 
  Peter_DB ( Слушатель )
03 май 2020 01:57:14

Как правильно составить выборку все знают. Это как раз не бином Ньютона. А вот является ли правильная выборка правильной применительно к коронавирусу, этого пока не знает никто) Даже «первые во всем» американцы. 
  • +0.04 / 2
  • АУ
 
 
 
 
  Nobody ( Слушатель )
03 май 2020 00:47:40

Плюс-минус миллион может получиться, если грубо. Но то такэ.
  • +0.08 / 4
  • АУ
 
  rufus ( Слушатель )
02 май 2020 21:28:33

Вообще фантастика  Шокированный
  • +0.03 / 1
  • АУ