Kali ( Специалист ) | |
28 фев 2018 21:48:24 |
Цитата7 февраля
«Статья может хорошо цитироваться потому, что она ошибочна»
Почему научную работу нельзя оценивать по ее цитированию
д.х.н., академик РАН Е.Свердлов
Почему библиометрия — плохой инструмент оценки работы ученого,
как нерадивая ассистентка подтолкнула к самоубийству выдающегося биолога, почему статью с будущим нобелевским открытием не взяли в престижный журнал и зачем нобелевский лауреат призывает бойкотировать высокорейтинговые журналы, читайте в колонке доктора химических наук, профессора, академика РАН Евгения Свердлова. Колонка представляет из себя переработанный фрагмент из статьи, которая вскоре выйдет в «Вестнике РАН».
Сегодня оценка ученых все в большей степени определяется уровнем престижности их публикаций. Эта политика пагубна для науки. Любые библиометрические данные, тем более импакт-фактор журналов, в которых ученые публикуются, не могут служить критерием эффективности исследований или ценности публикаций. Невоспроизводимость статей стала обычным явлением. Например, в области онкологии она достигает 75%. Растет количество статей, отзываемых из журналов ввиду допущенных ошибок или фальсификаций. Отзыв статей принял такие масштабы, что разрабатывается база данных Retraction Watch, которая уже содержит 16000 записей об отозванных статьях: более 1000 появилось только в 2017 году и 650 — в 2016 году. Стремление журналов повысить свой импакт-фактор приводит к тому, что статьи оцениваются не по их научному потенциалу и новизне, а по перспективе их цитируемости, в результате чего пионерские статьи зачастую отвергаются.
-----------
Самурай от науки
С тех пор как я опубликовал вышеупомянутую статью (которая никого не убедила), прошло меньше десяти лет и пришло трагическое событие: Йосики Сасаи покончил с собой. Это произошло 5 августа 2014 года. Вот как об этом рассказывает Дэвид Цираноски в Nature.
В дни, последовавшие за трагической гибелью Йосики Сасаи, ученые, журналисты и блогеры в Японии спекулировали о причинах этого события. 52-летний всемирно известный ученый, работавший со стволовыми клетками в Центре биологии развития (CDB) RIKEN в Кобе, был вовлечен в скандальное исследование. Две статьи по работам, выполненные под его эгидой и вызвавшие широчайший резонанс среди исследователей, занятых в очень модной области стволовых клеток человека и их применений в медицине, были опубликованы в Nature (импакт-фактор выше 40) в январе 2014 года.
В них описан способ преобразования зрелых клеток мыши в эмбрионально-подобное (плюрипотентное) состояние под действием различных стрессовых воздействий, например, путем их погружения в кислоту — метод, получивший известность как «получение плюрипотентности, вызванной стимулом» (stimulus-triggered acquisition of pluripotency, STAP). Это чрезвычайно важное открытие как с теоретической, так и медицинской точек зрения, поскольку оно позволяет достаточно просто получать стволовые клетки для трансплантации.
Однако очень скоро появились сообщения о подделках в опубликованных данных, и уже в июле 2014 года статьи были отозваны. Внутренняя комиссия по расследованию RIKEN в апреле обнаружила, что Харуко Обоката, молодая исследовательница, первый автор статей, виновна в фальсификации (этому посвящен специальный выпуск Nature «Рост и падение STAP» (The rise and fall of STAP). Внутреннее расследование также пришло к выводу, что Сасаи несет «серьезную ответственность» за невнимательное курирование работы, но невиновен в отношении любого прямого участия в получении подложных данных. Последовала целая серия отставок и широкое обсуждение причин случившегося. Сасаи не выдержал позора.
И это не единичный пример. Невоспроизводимость статей стала довольно
обычным явлением, и в 2015 году Nature опубликовал специальный выпуск, посвященный этой проблеме. Вот что говорится во введении к выпуску: «Наука развивается быстрее, когда люди тратят меньше времени на то, чтобы стремиться к ложным целям. Ни одна исследовательская статья никогда не может считаться последним словом, но появляется слишком много таких, которые не заслуживают дальнейшего изучения. Объяснения включают повышенный уровень внимания, сложность экспериментов и статистики и давление на исследователей. Журналы, ученые, учреждения и финансирующие организации участвуют в решении проблемы воспроизводимости. Nature предпринял существенные шаги для повышения прозрачности и надежности того, что мы публикуем, и для повышения информированности в научном сообществе. Мы надеемся, что статьи, содержащиеся в этом выпуске, помогут в этом».
Вынуждающее публиковаться давление понижает качество работы
Так названо эссе в Nature. Так написано, что если больше — это хорошо, то тенденции в науке благоприятны. Число публикаций продолжает расти экспоненциально; оно уже к 2012 году приближалось к двум миллионам. «Что более важно и вопреки общей мифологии, большинство статей цитируются. …Одна из вероятных причин роста ссылок — невероятные возможности поиска, которые теперь предоставляет Интернет. Казалось бы, это хорошая новость. Но что если больше — это плохо?» В 1963 году физик и историк науки Дерек де Солла Прайс посмотрел на тенденции роста в исследовательской деятельности и сделал вывод, что научные достижения обеспечиваются очень небольшим процентом исследователей, и поэтому число ведущих ученых будет расти гораздо медленнее, чем количество просто хороших, и это даст «еще большее преобладание исследователей, способных писать просто научные статьи, но не умеющих писать статьи выдающиеся».
В последние десять лет, прежде чем выбрать направление исследований, ученые в отделении гематологической онкологии биотехнологической фирмы Amgen в Калифорнии пытались подтвердить опубликованные результаты, связанные с этой работой. Пятьдесят три статьи, отобранных для анализа, были признаны «знаковыми» исследованиями. С самого начала ожидалось, что некоторые из данных могут не воспроизвестись, потому что были умышленно выбраны статьи, описывающие что-то совершенно новое: новые подходы в таргетной терапии рака или альтернативные клинические применения существующих терапевтических агентов. Тем не менее научные данные были подтверждены только в 6 случаях (11%). Даже принимая во внимание особенности доклинических исследований, это было шокирующим результатом.
В недавнем аналитическом обзоре Бегли и Иоаннидиса относительно ситуации с воспроизводимостью биомедицинских данных, авторы, известные специалисты в области статистической обработки результатов экспериментов, пишут: «Оценки частоты невоспроизводимости варьируют от 75% до 90%. …
Присущая биологическим системам изменчивость означает, что не следует ожидать, что результаты будут обязательно точно воспроизведены в мельчайших подробностях. Тем не менее кажется логичным, что один или два основных вывода, которые возникают из научной работы, должны выдерживать проверку. Кроме того, эмпирические оценки доклинических исследований показали массу других проблем, в том числе то, что эксперименты не повторялись, что использовались некорректные методы контроля, что качество реагентов не тестировалось и что использовались неправильные статистические тесты. Кроме того, исследователи для публикации часто выбирают наилучший эксперимент, а не суммируют полный набор данных».
В 2016 году Nature провел опрос более 1500 ученых относительно невоспроизводимости результатов. Указывается причина опроса: более чем 70% исследователей пытались и не смогли воспроизвести эксперименты, опубликованные другими исследователями. В связи с этим было задано несколько вопросов. Среди них: существует ли кризис воспроизводимости (52% ответили «да, сильный»; 38% — «да, незначительный») и какие факторы играют роль в невоспроизводимости (публикация выборочных данных >60%; вынужденность публикации >60%; низкая статистическая сила или плохой статистический анализ >55%).
Среди многих причин невоспроизводимости последнее время все большее место, особенно в высокорейтинговых журналах, занимают фальсификации, которые, при их обнаружении, приводят к отзыву статей. Боюсь, что многие подложные результаты остаются необнаруженными ввиду сложности и дороговизны проверок.
Средства огромные, качество данных вызывает сомнения
В Nature в 2012 году выразили, возможно в первый раз на форуме самого престижного научного журнала, тревогу не относительно того, что крупные проекты дают мало информации, поглощая огромные средства, а относительно получаемых при этом данных, качество которых вызывает много сомнений.
«В действительности никогда не было так легко получать высокоимпактные ложнопозитивные результаты, как в геномную эру, когда массивные сложные биологические данные дешевы и доступны. Для ясности: большинство экспериментов в масштабах полного генома дает реальные результаты, которые было бы невозможно выявить путем исследований, направляемых гипотезой. Тем не менее охота за биологическими сюрпризами без должных мер предосторожности может легко давать богатый урожай артефактов и приводить к высокоимпактным статьям, основанным не более чем на систематическом экспериментальном шуме».
Далее авторы рассуждают, почему возникают ошибки. По их мнению, существует два источника. Во-первых, исключительно большой размер генома означает, что очень необычный результат может появляться случайно чаще, чем можно интуитивно ожидать. Здесь может помочь статистика. Во-вторых, все высокопроизводительные геномные технологии дают ошибки, некоторые из которых могут быть систематическими, и на неопытный взгляд могут показаться интересным биологическим явлением. В результате исследователи могут прийти к ложным заключениям.
Многие области наук о жизни в настоящее время имеют дело с массивными объемами данных, так что связанные с технологиями производства больших массивов данных артефакты не ограничиваются геномикой. В результате снова и снова биологи не планируют эксперименты правильно и подают в печать недоработанные материалы, например, полученные с недостаточным для статистического анализа количеством образцов, а затем возвещают о случайных результатах, как о биологических эффектах…
Бойкот высокорейтинговых журналов
Рэнди Шекман, бывший главный редактор Proceedings of the National Academy of Sciences, лауреат Нобелевской премии 2013 года по физиологии и медицине, объявил, что он больше не будет отправлять статьи в «роскошные» научные журналы.......: «Эти журналы агрессивно курируют свои бренды, более способствуя продажам подписок, чем стимуляции наиболее важных исследований».
При этом высокая цитируемость конкретной статьи никак не связана со средней высокой цитируемостью всех статей, опубликованных в данном журнале. Если она есть, то это никак не связано с качеством статьи. Шекман пишет: «Статья может хорошо цитироваться потому, что она сообщает важный научный результат, или потому, что она привлекает глаз провокационным заголовком, или, наконец, потому, что она ошибочна. Редакторы журнала Luxury знают об этом, поэтому они принимают статьи, которые будут цитироваться, потому что они исследуют модные темы или содержат бросающиеся в глаза заявления».
------
Мы видим в России, как создается то, что Шекман назвал пузырями. Одни и те же исследователи, которые нашли способы опубликовать свои статьи в престижных журналах, у нас получают гранты, что способствует новым публикациям и, следовательно, новым грантам и т. д. Создается «пузырь», который часто не зависит от реальной значимости проблемы и который, возможно, отвлекает деньги от пионерских исследований, не набравших еще большой публикационной силы, то есть не вошедших в Гумбольдтовскую стадию «в этом что-то есть».
----
«Публикация в престижном журнале может принести хорошую должность, приглашения на конференции, гранты и денежные вознаграждения»
Так говорится в статье в журнале Nature от 16 октября 2013 года. Я остановлюсь на этой статье более подробно. На мой взгляд, она несет информацию, над которой имеет смысл задуматься нашим администраторам разных уровней, да и для ученых она не безынтересна.
Исследователи говорят, что публикация в престижных журналах может помочь сделать карьеру. И в течение многих десятилетий наиболее популярными из этих журналов были Nature и Science — широко читаемые журналы, которые отвергают более 90% рукописей, которые они получают. Однако издательский мир быстро меняется, и ведущие издания сталкиваются с растущей конкуренцией. Движение за публикации с открытым доступом набирает скорость. С 2010 года появилось более 5000 (!) журналов с открытым доступом. Эти журналы привлекают все большую долю представлений, угрожая популярности ведущих журналов.
Заключение
Я уверен, что большинство ученых все это понимает, и, более того, думаю, что и многие руководители науки тоже. Однако проще двигаться по пути формальных оценок, чем найти способы выработки объективных критериев оценки качества работ. В результате импакт-фактор стал единственным или основным критерием оценки. Хотя, если говорить об использовании библиометрических показателей, более корректным является использование индекса цитирования, при этом он тоже имеет свои недостатки. В результате люди, которые занимаются очень важными, но по тем или иным причинам непубликуемыми на данном этапе работами, оказываются обойденными.
Мне приходилось выполнять работы, в частности, по созданию первого отечественного рекомбинантного интерферона, которые очень мало публиковались, но сыграли существенную роль в отечественной медицине и, что немаловажно, помогая руководству Академии, в частности вице-президенту Юрию Овчинникову и академику-секретарю Александру Баеву, убедить руководство страны в том, что развитие биотехнологии и физико-химической биологии — это важно и что на эти направления следует выделить достойные деньги. Эта работа практически не цитируется, но я считаю ее одной из самых важных своих работ.
В моей лаборатории сейчас работает группа талантливых молодых людей, которые создали генно-терапевтический противоопухолевый препарат и сейчас пробивают лбом стену, проводя его доклинические испытания. Это требует гигантских усилий, поскольку в мировой практике только один препарат такого рода получил разрешение на использование, и у разрешительных инстанций нет соответствующего опыта и выработанных критериев оценки. Конечно, такая работа не может иметь многих публикаций, как в свое время и работа по интерферону. Я думаю, что в стране есть и будут впредь многие другие подобные примеры. Поэтому критерии значимости работы должны учитывать многие факторы, которые разумной экспертной оценкой несомненно могут быть учтены. Это поможет правильному, а не пузыреподобному развитию нашей науки.
grizzly ( Профессионал ) | |
28 фев 2018 23:12:36 |
Цитата: Kali от 28.02.2018 21:48:24
Dobryаk ( Профессионал ) | |
01 мар 2018 04:52:12 |
Цитата: Kali от 28.02.2018 21:48:24
Цитатаhttp://www.atominfo.ru/newsp/w0443.htm
В СССР наукометрия отсутствовала как класс. В России превый наукометрический список (индекс цитирования) был обнародован в 2001, первая публикация в СМИ была в 2002
http://www.ng.ru/science/2002-06-26/11_citate.html
Ядерная физика и физика высоких энергий всегда были в пионерах. Как хорошо известно, интернет с современным протоколом был создан в ЦЕРН-е (Европейском центре ядерных исследований) из-за утилитарных нужд обработки огромных массивов экспериментальных данных. Ровно так же первый некоммерческий центр наукометрии HEP SPIRES начал работать еще в 70-х в Стэнфордском центре линейных ускорителей. Как и электронный некоммерческий архив по физике был создан около 90-го при Лос-Аламосе теоретиками, занятыми т.н. решеточной квантовой хромодинамикой.
До взрывного развития науки в 60-х (во всем виноват спутник! а до него ядерное оружие!) все ученые были как бы персонально знакомы каждый со всеми. Когда круг лично знакомых стал каплей в море, возникла нужда в сравнении знакомых с незнакомыми. Потребовался аршин. Родилась идея индекса цитирования.
Вначале все было просто, как мычание.
Если ты в своей публикации в какой-то мере используешь результаты предыдущих авторов, то как честный человек ты на него ссылаешься. Автор той работы получает в свой послужной список, получивший название индекс цитирования, одну галочку. Чем чаще на работу ссылаются, тем она важнее --- т.е., можно выстраивать авторов по числу галочек, т.е., индексу цитирования. Все логично: если на твою работу никто не сослался, то это макулатура, много ссылок --- хорошая работа.
В целом корреляция между значимостью ученого и его научным авторитетом и индексом цитирования заведомо положительная. Работы с индексом цитирования за сотню, в полтыщи, за тыщу, в самом деле великие.
Но случаются и казусы: есть публикации с бешеной цитируемостью, в которой нет, по-существу, ни одного правильного ответа. Но автор взглянул на проблему под правильным углом и сформулировал правильный путь решения задачи. А вот владения математикой ему не хватило. Зато другие, кто никогда в жизни паровоза не придумали бы, смогли задачу раздраконить. Есть коллаборации теоретиков, которые лет по 10 публикуют только совместные статьи, и роль авторов в троице четко разделена: этот генерит идеи и вполне техничен, этот чистый технарь, а третий всегда впопад задает ехидные вопросы, спускает увлекшихся соавторов с небес на Землю до того, как они рухнули бы и разбились, и ставит на правильные рельсы, ведущие к успеху. Когда такие троицы по разным причинам распадаются, то становится ясно, что роль каждого их них была критически важной — поодиночке каждый из них намного мельче, чем трать от той троицы.
Далее оказывается, что все зависит от тематики. Расцвет кондовой ядерной физики, т.е., спектроскопии, изучения свойств конкретных ядер, ядерных реакций при низких и промежуточных энергиях --- это 50-60-70-е. С 80-х интерес сместился на экзотические ядра и процессы, важные для ядерной астрофизики. Число ядерных центров резко сократилось. Поэтому самые блестящие работы в этой области соберут цитирований на порядок меньше, чем работы по физике высоких энергий, а эти в свою очередь проиграют вдвое-втрое авторам по математической физике.
Итак, аршин оказывается неуниверсальным.
В физике высоких энергий ситуация временами смехотворна и драматична одновременно. На Большом Адронном Коллайдере все жаждут увидеть новое явление. Все время вылезают пупыри от трех до пяти стандарнтых отклонений, на которые голодные орды теоретиков изобретают полсотни объяснений и через две-три недели электронный архив уже завален полтыщей препринтов. Часть из них даже успевает прошмыгнуть в журнал, прежде чем экспериментаторы объявят, что это был статистический выброс. Нечто подобное в тогдашней физике элементарных частиц было в 60-е, когда каждую неделю в разных лабораториях открывали по одному новому резонансу. Тогда считалось приличным обсуждать эффекты, начиная с трех стандартных отклонений. Доведенный до отчаяния Леон Розенфельд, команда которого тогда отвечала за регистрацию таких открытий, объявил, что отныне ничего со статистической обеспеченностью менее пяти стандартных отклонений он даже читать не будет. И в целом он был прав. С тех пор, наперекор законам статистики, этот стандарт в пять стандартных отклонений стал почти законом.
В 97-м три автора из ПИЯФ, Гатчина опубликовали теоретическое предсказание экзотического бариона с положительной странностью. Его увидели в Японии. В российской прессе и на телевидении заговорили о нобелевской премии. Началась вакханалия подтверждений и закрытий. По теме за 4-5 лет было опубликовано под 900 (!) статей --- таков индекс цитируемости этой статьи из ПИЯФ. Дело закончилось окончательным доказательством, что такого бариона нет.
В 90-е и в начале 2000-х индекс цитируемости (индекс Хирша в "нормальной" ситуации мало чем отличается от средней цитируемости на одну публикацию) царил при приему на работу. С ним было так легко --- любой бухгалтер, ни ухом ни рылом не ведающий о разнице между физикой и физиологией, мог просчитать цену кандидату в профессора. Первыми спохватились мелкобриты, которые исключили этот критерий из главных.
Но у бухгалтеров из ФАНО шеей можно Землю по экватору обернуть трижды, а может и десять раз. До их голов дошел только один сигнал: всем на свете достижениям можно выставить цену в условных тугриках. И их интересует только эта цена.
Заключение: в индексе Хирша и индексе цитирования, с оглядкой на аршины разной длины в разных племенах, несомненно есть объективность. Но нельзя тупо сравнивать картоху с ананасами. Но нет в ФАНО мозгов, способных понять разницу между овощами, ягодами, фруктами, рыбой и мясом.
baldprice ( Дилетант ) | |
01 мар 2018 09:44:39 |
Цитата: Dobryаk от 01.03.2018 04:52:12
Dobryаk ( Профессионал ) | |
01 мар 2018 09:57:35 |
Цитата: baldprice от 01.03.2018 09:44:39
baldprice ( Дилетант ) | |
01 мар 2018 11:04:20 |
Цитата: Dobryаk от 01.03.2018 09:57:35
grizzly ( Профессионал ) | |
01 мар 2018 15:54:31 |
Dobryаk ( Профессионал ) | |
01 мар 2018 16:55:21 |
Цитата: grizzly от 01.03.2018 15:57:41
Kali ( Специалист ) | |
01 мар 2018 22:33:03 |
Цитата: Dobryаk от 01.03.2018 16:55:21
Dobryаk ( Профессионал ) | |
02 мар 2018 06:07:23 |
Цитата: Kali от 01.03.2018 22:33:03