50 лет на Луне. Факты.Техника. Юбилей
449,522 2,686
 

  перегрев ( Слушатель )
13 фев 2018 01:14:14

Приключения Истинного Лунного Парня (pmg) в стране Корреляции. Путешествие первое.

новая дискуссия Дискуссия  297

Все началось с того, что мне в личку постучался один опроверг, широко известный в узких кругах своими монументальными трудами о делении миллиграммов на количество листов формата А4 и наоборот. Как всегда с обилием смайликов, восклицательных знаков и прочих визуальных признаков сильного душевного волнения. Данное существо, путаясь в словах и брызгая слюной, сообщило мне о новом оригинальном и неубиваемом доказательством нелетания, вышедшего из под маститого пера "мэтра" местного опровергательства – полного гуманоида под ником pmg. Кстати спасибо кабальеро Alexxey за любезно предоставленные ссылки, а то так бы и канули эти "жемчужины" в небытие. Незаслуженно забытые и не оцененные...

В принципе, благородный дон normalized в своем посте практически все про корреляцию рассказал, но мне показалось небезынтересным воспроизвести ход мыслей и порядок "расчетов", так сказать, "мэтра"Веселый И "мэтр" снова не подвёл... Веселый 

Итак, в своем очередном сакральном откровении клиент, "искусно" Веселый используя элементарные понятия базовой математической статистики ринулся доказывать, что "...что американский грунт это просто советский..." Заход к "доказательству" был выполнен технично и в лучших традициях упоротой опропрофессуры. Улыбающийся

ЦитатаС чего вы взяли что разные? На глазок что ли? Это требует доказательства. Во первых всегда есть ошибки измерения как минимум процентов 10%. Т.е если вы два раза измерите одно и тоже то полученные результаты обязательно будут немного отличаться. С этим можно бороться усреднением многих измерений.

Ну, то рядовой опроверг ничего не знает про метрологию это норма. Но гражданин pmg неоднократно прямо заявлял, что он какой-то там вроде ученый и где-то там даже якобы публиковался. Мне вот интересно в каком же колхозе выращивают ученых которые ни ухом, ни рылом, про то как оценивается достоверность и воспроизводимость измерений, как определяется систематическая и случайные погрешности измерений, и которые считают, что результаты измерений тупо усредняются? Впрочем, поручик Бомбардир его уже по этому поводу облюбил в особо извращенной форме, не будем повторяться...Подмигивающий
ЦитатаВот в данных по измерению хим. состава Луны-16 приведены эти ошибки измерения как стандартное отклонение от среднего по многим измерениям.

Тут наш упоротый профессор привычно сел в лужу.
Во-первых, данные в которых приведен диапазон значения (образцы Г-3 и А-3) это результаты американских измерений грунта Луны 16, которые выполнены неким новым способом (миниатюризованным рентгено-флуоресцентным методом), а не наши измерения.
Во-вторых, совершенно непонятно о каком стандартном отклонении чего и от чего идёт речь. Прямо же написано, ошибки при измерении "стандартных образцов". Т.е., ошибки при 95% доверительном интервале это два стандартных (среднеквадратичных) отклонения серии измерений стандартного образца новым методом. Полное впечатление, что для нашей "опропрофессуры", ключевым словом здесь оказалось прилагательное "стандартное". Т.е. человек разницы между "стандартным отклонением" и "стандартным образцом" тупо не понимает. 
Для публики поясню, что стандартным образцом называется образец количество измеряемого  вещества в котором известно заранее и с высокой точностью.

Дальше – больше
ЦитатаВ американских данных этого почему то нет а должны были бы дать и ошибки. Но дело даже не в этом. Между нашими, между американскими и между нашими и американскими данными можно рассчитать коэффициенты корреляции. В случае полного отсутствия какой либо связи между данными эта величина естественно близка 0 а в случае полной идентичности 1.0. В случае статистически значимого отличия хим. составов эти коэффициенты будут ниже чем в случае незначительных отличий из-за ошибок измерений например. Таким образом это можно интерпретировать как вероятность того что это ИДЕНТИЧНЫЙ материал.


Вот это безусловно шедевр. Причем шедевр на все времена. Когда я хулиганил с корреляцией "количественного показателей процесса доставки грунта"Веселый я честно признался, что смухлевал. Правда я сразу сказал, что опроверги никогда не догадаются где мухлёж, но мне и в голову не пришло, что моя невинная шалость так тяжело контузит наше бойкое, но увы малограмотное сообщество опровергателей. 

Товарищи опроверги, прежде чем в очередной раз считать в Ёкселе коэффициент корреляции уясните несколько простых правил. Опять же из области базовых понятий математической статистики.

1. Коэффициент корреляции Пирсона всего лишь показывает насколько отличается закон изменения одной случайной величины и другой случайной величины от линейной зависимости.
2. Никакой, даже самый высокозначимый коэффициент корреляции сам по себе никоим образом не свидетельствует, что между двумя случайными величинами существует причинно-следственная связь или что обе величины характеризуют один и тот же процесс. Ровно также справедливо и обратное – даже равный нулю коэффициент корреляции сам по себе еще не свидетельствует, что между двумя величинами не существует причинно-следственной связи или обе величины характеризуют один и тот же процесс. Для такого рода заявлений надо проводить дополнительные исследования. Дружище normalized доходчиво и наглядно рассказал о существовании "ложных" корреляций.
3. Посмотрите наконец на формулу коэффициента корреляции. Там используется среднее значение и стандартное отклонение. Рассчитывать "средний" процент и "стандартное отклонение" процента (а таблица по которой наш друг считал корреляции включает в себя исключительно проценты) также глупо как рассчитывать среднее "количественных показателей процесса доставки лунного грунта". Наглядный пример:

Грунт А11 и А12 и грунт А11 в котором процент минералов уменьшен в 10 раз

А11
А12
А11 деленное на 10
А12
SIO2
41,9
45,9
4,19
45,9
TiO2
7,56
2,81
0,756
2,81
Al2O2
13,6
12,5
1,36
12,5
FeO
15,9
16,4
1,59
16,4
MnO
0,21
0,22
0,021
0,22
MgO
7,82
10
0,782
10
CaO
12,1
10,4
1,21
10,4
Na2O
0,4
0,41
0,04
0,41
Ka2O
0,13
0,25
0,013
0,25
R
0,9832

0,9832


Коэффициент корреляции между А11 и А12 – R=0,9832
Теперь тупо проценты А11 все разделим на 10

Угадайте с трёх раз каким будет коэффициент корреляции?. Желающие могут проверить – всё те же 0,9832 Веселый
А теперь внимание вопрос: грунт с химическим составом как в колонке "А11 деленное на 10" точно такой же как в колонке "А12"? Или это же совсем другой грунт и с другой планеты?Веселый Чисто по секрету и исключительно для гражданина pmg если посчитать коэффициент корреляции для А11 и "А11 деленного на 10", то там вообще коэффициент корреляции будет равен единицеВеселый Просто один и тот же грунтВеселый

Если уж кому-то неймется осваивать Ёксель и считать корреляции по грунтам, то считать его нужно для процентного содержания одного вещества в разных пробах. Например вот так;

А11
А12
А14
Л16_Вин
Обр Г-3
Обр А-3
R
SIO2
41,9
45,9
47,2
41,7
44
45
0,998052587
TiO2
7,56
2,81
1,79
3,38
3,3
3,5
-0,277647866
Al2O2
13,6
12,5
17,2
15,3
16
16
0,29356962
FeO
15,9
16,4
10,4
16,6
16
16
0,433554985
MnO
0,21
0,22
0,14
0,21
0,23
0,23
-0,397359707
MgO
7,82
10
9,37
8,78
8,51
8,12
-0,611539312
CaO
12,1
10,4
11
12,5
12,1
12,1
0,937509342
Na2O
0,4
0,41
0,66
0,34
0,42
0,42
0,529106716
Ka2O
0,13
0,25
0,58
0,1
0,09
0,11
0,708082774

Здесь коэффициент корреляции считался построчно: для каждого минерала определялось корреляция между советским и американским грунтом. Как мы видим всего две высокозначимые корреляции – по SIO2 и CaO. Что как бы намекает о том, что тезис видного деятеля опровергательства о том, что американцы выдают грунт Луны-16 за грунт привезенный Аполлонами летит в урну задорно помахивая ушами. Как оно всегда бывает у опровергов.Веселый

Ну и напоследок не могу не обойти вниманием еще один характерный пассаж

ЦитатаНо еще интереснее корреляция между нашими и американскими данными 0,992408, 0,994026, 0,987983, 0,993206, 0,994134, 0,988766. Они даже систематически выше чем между американскими данными и почти такие же высокие как между нашими с одного и того же места посадки.

Вообще-то насколько статистически значимо отличаются несколько числовых последовательностей тоже можно проверить с помощью методов математической статистики. Например, при помощи критерия Вилкоксона Веселый Тпру товарищи статистики, если можно  считать "средние проценты", то почему нельзя применять законные методы непараметрической статистики? Гулять так, гулятьУлыбающийся Вот в этой табличке приведены коэффициенты корреляции посчитанные по методе "профессора" pmg 
А11_А12
0,989323
Л16_А11
0,992231
А11_А14
0,981062
Л16_А12
0,99309
А12_А14
0,982505
Л16_А14
0,981987

Так вот, по критерию Вилкоксона (желающие могут проверить) статистически значимых различий между коэффициентами корреляции американских грунтов между собой и коэффициентами корреляции между грунтом Луны-16 и американскими грунтами нет. В данным случае просьба профессионалам особо ногами не пинать. УлыбающийсяУж в любом случае это более корректная оценка (при всех ясно понимаемых мной определенных натяжек почти невинного характера), нежели высосанное из пальца "систематически выше". По критерию Стюдента, кстати, тоже самое получается, но это  уже явный перебор.Веселый

В общем чего хочется сказать в итоге.
Путешествие нашего Идеального Лунного Мальчугана в страну Корреляции оказалась увлекательным и поучительным. В ходе него выяснилось, что:
1. Юноша ни фига не знает об элементарных основах физических измерений и элементарных правилах обработки статистических данных и, соответственно, ни фига не умеет.
2. В результате бездумного использования фигурантом табличного процессора Excel были сделаны абсолютно безграмотные и бессмысленные выводы не стоящие и выеденного яйца. Сопровождавшие весь этот бред "глубокомысленные" и псевдонаучные многословные сентенции только усугубили и без того удручающее впечатление от уровня знаний товарища  pmg
3. Афера опять устояла. Веселый
P.S. Продолжение следует... Там еще один пост был за корреляции..Улыбающийся
  • +0.48 / 13
  • АУ
ОТВЕТЫ (2)
 
 
  перегрев ( Слушатель )
14 фев 2018 22:53:02
Идиотская конечно схема отвечать на собственные сообщения. Но альтернатива ещё хуже – модератор-опроверг. Бррр. Это как на ветке УРО – модератор упоротый кастрюлеголовый. Только хуже. Поэтому коротенькие пояснения по результатам многословного, но, сцука, вяловатого отбрёхивания нашего "лунного мэтра". Как бы слов много, но собственно про статистический анализ вообще нет ничего. Итак

ЦитатаЧто тут с чем коррелирует то?

Это клиент удивился за коэффициент корреляции между процентным содержанием в разных пробах грунта. Объясняю для особо альтернативно одарённых. Имеется (условно) тридцать проб грунта. В каждой свой процент соответствующего вещества. Из этих тридцати – 15 сделаны одной страной и 15 другой. Одним из способов проверки, что одна страна действительно отбирала грунт, а не цинично скосоплеила данные другой стороны является следующий. Для каждого вещества,  пишется табличка из двух столбцов. В первом пишется количество одного вещества в 15 пробах одной страны, во втором второй. Потом считается коэффициент корреляции Пирсона. Если большинство корреляций высокозначимые, то с большой долей вероятности можно предположить, что все пробы взяты с одного места. Если наоборот – то гипотеза о том, что что это одно и тоже место отвергается. Также с определенной вероятностью. Причем все эти вероятности опять же считаются. Но для опровергов это всё слишком сложно...
ЦитатаТезис про "причинно-следственные связи"автор сам из пальца высосал и потом начал с ним бороться. R это величина всего лишь характеризует статистически значимую зависимость одной величины от другой, типа одно растет и другое растет или одно растет другое падает (антикорреляция). Не более и не менее.

Веселый Здесь вообще нечего комментировать. Человек только, что сам расписался в том, что не знает и не понимает, что такое корреляция. Еще разок для особо тупых – даже самая высокозначимая корреляция ни фига не означает, что одна величина зависит от другой. Тем более коэффициент корреляции не характеризует никакой зависимости. Ни "статистической значимой", ни вообще какой. Там всё наоборот. Коэффициент корреляции рассчитывается с определенным значением статистической значимости которое задается исследователем. Стандартным является значение 0,05. Но пишет же опроверг. Он таких тонкостей просто не знает. Хотя какие это "тонкости"? Это элементарные понятия математической статистики.

ЦитатаРаздражает дурацкий тон


И это хорошо. Этого и добивались. Веселый Это я безусловно, молодец. Тут как говорится, что да, то да. Ни убавить, ни прибавить.Веселый

Цитата... и пассажи типа "Теперь тупо проценты А11 все разделим на 10" зачем их делить на 10? почему не на 20?, почему обязательно делать это тупо...?

Ну тут ответ очевиден. Что бы дошло до самых тупых. Это называется "иллюстрация". Есть материал который содержит различные вещества в следующем процентном соотношении 65:20:10:1 и другой материал со следующим процентным соотношением 80:10:5:0,5 тех же веществ. Коэффициент корреляции между этими материалами будет 0,985 (что кстати больше, чем коэффициент корреляции между процентами грунтов А11 и А14 в приснопамятной табличке). Риторический вопрос такой корреляции достаточно, что бы сделать вывод о том, что оба материала представляют собой грунт с одной и той же планеты? Или нет? Веселый
P.S. Над массой ляпов в неуклюжем отмазе pmg можно было бы стебаться очень долго. Но смысл? И так всё ясно.... Первый тезис Старого во всей красе. Клиент ни ухом, ни рылом в вопросах о которых берётся с непростым жалом рассуждать.
  • +0.36 / 11
  • АУ
 
 
  Technik ( Слушатель )
27 фев 2018 14:05:40

Со зверинцем поведешься - и не такого наберешься...
  • +0.14 / 10
  • АУ