Открытая производная субъективная оценка

Captain Tylor
22 июл 2010 21:12:38 ...

Captain Tylor

22 июл 2010, 21:12:38

Слушатель

Карма: +2.73
Регистрация: 05.10.2008
Сообщений: 513
Читатели: 0

Тред №240038
Дискуссия 198 0

Думаю, ни для кого на этом форуме не секрет, какой силой обладает пропаганда, насколько сложно бывает отличить правду ото лжи, особенно если это касается политики. У меня довольна давно в голове вертелась идея о том, как можно значительно облегчить поиск и распространение достоверной информации, и затруднить, соответственно, пропаганду ложной. Сегодня, наконец, заставил себя собрать мысли и оформить. Просьба прокомментировать, насколько это ново, реализуемо, применимо и т.д.

Открытая производная субъективная оценка - это метод поиска, структуризации и верификации информации. Собственно, ее идея очень проста. Дать возможность автоматически конструировать оценки на основе других оценок.

Имеется в виду следующее. Создается система, позволяющая выставить оценку чему-то - статье, страницы, сайту, мнению, человеку, организации и т.д.
Для простоты допустим, что оценка - это числовое значение, оценивающее, насколько "нравится" оценивающему объект оценки. Далее, кто-то может заметить, что есть люди, которым нравится то же, что и ему. Он описывает правило, которое позволяет выводить оценку на основе оценок этих людей. Например, может браться среднее значение их оценок. Правила могут быть чуть более сложными - скажем, чьим-то голосам будет даваться больший вес, чем другим. Оценка, полученная с использованием таких правил - это "производная" оценка, оценку же, выставленную "вручную" будем называть "исходной". Производную оценку может использовать сам автор правила, чтобы примерно определить, насколько "понравится" ему что-либо, без необходимости проверять все самому. Но он может также сделать эту оценку открытой для других, и тогда уже другие пользователи смогут создавать свои производные оценки на основе в том числе и его производной оценки. Это позволяет строить и настраивать "под себя" правила, учитывающие прямо или опосредованно мнение практически неограниченного количества человек. Как "исходные" так и "производные" оценки, полученные таким образом отражают интерес к объекту с точки зрения определенного субъекта - автора оценки или правила. Поэтому такие оценки называются "субъективными".

Совокупность правил, созданных и используемых каким-то человеком является, в некотором роде, его дублером ("дублем") в сети, который "знает" о его предпочтениях и может принимать решения, близкие к тем, которые принял бы сам человек, хотя и в очень ограниченной области.

Имея представления о нейронных сетях, несложно заметить, что получившаяся система является одной из них, а каждое правило - это нейрон в этой сети. Особенностью этой сети является то, что у каждого "нейрона" есть хозяин, и сеть в целом создается и модифицируется многими людьми. При этом практически полностью исключена возможность как-то ее саботировать - невозможно как-то "испортить" чужие правила, а заведомо ложные оценки и правила просто не будут (или перестанут) использовать.

Как видим, система позволяет при минимальных накладных расходах определить "интересность", например страниц в Интернете со сколько угодной точностью, в зависимости от "качества" правил и авторов оценок, на которые эти правила опираются. Причем интересность субъективную, соответствующую индивидуальным представлениям и ценностям. Разумеется, как правило мы ищем в интернете не просто "что-то интересное", а материал на какую-то определенную тему. Тогда производную оценку можно использовать совместно с "классическими" поисковиками, которые анализируют текст страницы на наличие ключевых слов. В этом случае производная оценка может, например, отсортировать найденные страницы по субъективной "интересности".

Техническая реализация. И оценки, и правила имеют очень простую структуру.
Оценка состоит из идентификатора оцениваемого объекта, собственно оценки "интересности" или каких-то других свойств объекта, и идентификатора оценивающего. В самом простом виде это просто строчка, содержащая URI (в качестве идентификатора объекта), число (в качестве оценки) и цифровую подпись оценивающего. В таком виде оценка не может быть подделана, однако может быть скопирована, сохранена, передана и использована любым мыслимым способом. Например, она может выкладываться на разные сайты, передаваться через e-mail, через p2p сети и так далее. После публикации она становится практически неуничтожимой, что может быть для автора как преимуществом, так и, в некоторых случаях, недостатком - если эта оценка ошибочна или ложна.
Возможен вариант, когда в качестве идентификатора автора служит его аккаунт на каком-то ресурсе, и этот же ресурс служит гарантом подлинности, по аналогии с Digg-ами, StumbleUpon-ами и десятками других аналогичных сервисов. Такой способ не требует использования цифровой подписи, но сильно ограничивает возможности по использованию оценки и делает ее зависимой от технической и этической надежности этого ресурса. С другой стороны, это дает возможность "уничтожать" неудобные оценки.

Представление правил тоже несложно. Например - просто список источников с числовыми весами, плюс цифровая подпись автора оценки. Источники могут быть идентифицированы, скажем, их открытыми ключами, которые позволяют найти и проверить подлинность их оценок.
В реализации без цифровой подписи ссылка на источник - это их идентификатор на ресурсе - например, логин или номер.

Далее будем называть те оценки и правила, которые общедоступны "в исходниках", не привязаны к одному интернет-ресурсу, используют цифровую подпись или ее аналог для удостоверения подлинности, "открытыми", по аналогии с "открытым исходным кодом". Если они привязаны к какому-то ресурсу, то они "проприетарные". Также могут использоваться "секретные" правила и оценки, предназначенные исключительно для личного использования.

Открытые правила (и, в некоторых случаях), оценки, могут содержать временные рамки, в которых они действительны.

Идентификатор автора оценки или правила совершенно не обязательно должен соответствовать какому-то определенному человеку. Более того, для сохранения конфиденциальности не рекомендуется афишировать какой человек какому "автору" соответствует. Кроме того, один человек может использовать несколько различных идентификаторов, например, для оценок и правил, относящихся к разным сферам интересов и имеющих разную степень "надежности".

Гарантом "правильности" оценки или правила являются прошлые оценки или правила того же автора. Ошибочность, нерегулярность оценок может быть причиной отказа от их использования в правилах. Ангажированность оценки может сделать в некоторых случаях автора более интересным, по крайней мере, среди людей со схожим мировоззрением. Если автор в течении некоторого времени выставляет точные оценки, то все большее число людей начинают использовать его оценки в своих правилах. Можно сказать, что у этого автора появляется репутация эксперта, причем в данном случае эту репутацию можно точно измерить и анализировать.

Заметим, что правила и оценки - "декларативны", т.е. это не какой-то сервис, выдающий оценку, а данные, на основе которой эта оценка может быть определена. Если они проприетарны, то вычисление проводит ресурс, на котором они опубликованы. Если они открыты, то это может делать какой-то публичный сервер. Также это может делать и программа на компьютере пользователя, но это может быть затруднительно, если используются правила, учитывающие (прямо или опосредованно) очень большое количество оценок. Однако, это может быть наилучшим вариантом для "секретных" оценок.

Насколько такая система сложна в использовании. Выставление оценок может быть очень простым, аналогично уже упомянутым Digg-оидам. Для проприетарных оценок это может быть просто клик на ссылке. Открытые оценки могут потребовать, например, плагина к броузеру, но позволят оценивать любые страницы одним кликом, и позволят полностью скрыть закрытый ключ, используемый в подписи, от кого-либо. Также следует при этом помнить, что ошибочные оценки может существенно испортить репутацию оценивающего. С другой стороны, постоянно точные оценки делают "голос" оценивающего гораздо более значимым, чем просто +1 безликий голос в традиционных системах.

Сложность составления правил может сильно варьироваться в зависимости от требовательности составителя. В простейшем варианте это не сложнее, чем "френдование" в livejournal, facebook или аналогичных системах. Однако, возможна и более "тонкая" настройка правил, в зависимости от требований к ней. Когда правило дает оценку, не соответствующую критериям автора правила, может понадобится анализ причин, по которым такая оценка была получена. Для этого могут быть полезен как анализ чужих правил, которые используются опосредованно, так и исходных оценок, которые прямо или опосредованно были использованы. Это позволит изменить правило так, чтобы оно было более точным, либо понять и согласиться с оценкой, которая казалось неправильной, и, возможно, даже изменить свои критерии "правильности". Таким образом, не только человек может менять своего "дубля", но и "дубль" может иногда менять своего автора.

Исходная оценка или правило могут содержать комментарий, объясняющий почему они именно такова. Это также может помочь в определении причин тех или иных производных оценок и в оптимизации правил.

Правила могут генерироваться автоматически в зависимости от исходных оценок и другого поведения человека. Например, может использоваться поиск пользователей, которые выставляют оценки схожим образом, и правило будет построено на основе их оценок.

Многие существующие методы сетевого общения могут быть сделаны более эффективными с использованием производных оценок.

Например, wiki без администраторов, вандализма и войн правок. Может существовать сколько угодно вариантов страницы одновременно (или даже частей страницы) - с помощью производной оценки каждый может получить тот вариант, которые его наиболее устраивает.

Другая область использования - форум без модераторов, спама и троллей. Функции модерации может выполнять производная оценка - посты с низкой или отрицательной производной оценкой будут просто не показываться. Также можно, например, сортировать ответы на какой-то вопрос по "интересности". В некотором роде получается, что на таком форуме каждый может быть модератором и выбирать модераторов для себя.

Другой способ использования производных оценок - это augmented browsing, т.е. плагин для браузера, который "улучшает" показываемые им страницы. Например, он может отмечать разным цветом ссылки в зависимости от их "интересности", менять порядок вывода результатов в поисковиках, скрывать ненужную информацию и т.д.

Использование более сложных оценок, чем просто числовое значение, несколько усложняет их использование, но дает много новых интересных возможностей.
Например, оценка может содержать ключевые слова, описывающие тематику материала, связи его с другими материалами и т.д. Говоря проще - в качестве оценки может быть использован один из вариантов RDF, используемых в Semantic Web (или - объектом оценки может быть RDF, который содержит всю необходимую информацию - это примерно то же самое с практической точки зрения). Это позволит, например, не просто получить информацию, что какой-то материал "неинтересен" или "ложен", но и о том, что именно в нем неправильно и где можно получить более точную или полную информацию по аналогичному вопросу.
Другие способы использования таких оценок практически повторяют предполагаемую сферу использования Semantic Web, с тем отличием, что в этом случае разрешены некоторые из проблем Semantic Web - например, проблема достоверности метаданных. Достигается это за счет замены недостижимой "объективной" достоверности на "субъективную" достоверность, которая определяется с помощью производных оценок. Это в свою очередь позволяет добавлять к веб-страницам семантическую информацию не только "хозяину" страницы, а кому угодно, что делает все существующие веб-ресурсы потенциально совместимыми с Semantic Web.

Первоуральск, 22 июля 2010

+0.19 / 2

АУ

идущий
23 июл 2010 00:32:24 ...

идущий

23 июл 2010, 00:32:24

62 года

Слушатель

Карма: +9.81
Регистрация: 14.09.2008
Сообщений: 106
Читатели: 0

Тред №240148
Дискуссия 246 1

Идея такая: для начала зарегистрированные ползователи делятся на группы по произвольному принципу, например по возрасту или профессии. Хотя бучше продумать это сразу, в зависимости от темы сайта или форума. Таким образом сразу образуется "правило" о котором вы говорите. Пользователи и автор поста могут видеть рейтинг сообщения в разных группах "оценщиков". Со временем, с накоплением статистики, на основе совпадения оценки скажем 20-30 постов автоматически создаются группы "единомышленников".
Каждый пользватель определяет группу авторитетных для себя "оценщиков". Таким образом, пользователю становится легче
ориентироваться в большом количестве сообщений и не пропустить что-то интересное для себя.
Вот такая идея пришла мне в голову примерно пол года назад. Недавно решил ее реализовать, увы не специалист ни разу, начал изучать проектирование баз данных и SQL.
PS Кажется моя идея похожа на вашу

, или я не понял ничего.

+0.08 / 1

АУ

Captain Tylor
23 июл 2010 01:08:58 ...

Captain Tylor

23 июл 2010, 01:08:58

Слушатель

Карма: +2.73
Регистрация: 05.10.2008
Сообщений: 513
Читатели: 0

Дискуссия: Тред №240148

Цитата: идущий от 23.07.2010 00:32:24
Каждый пользватель определяет группу авторитетных для себя "оценщиков". Таким образом, пользователю становится легче
ориентироваться в большом количестве сообщений и не пропустить что-то интересное для себя.
Вот такая идея пришла мне в голову примерно пол года назад. Недавно решил ее реализовать, увы не специалист ни разу, начал изучать проектирование баз данных и SQL.
PS Кажется моя идея похожа на вашу, или я не понял ничего.

Вобщем, да, идея та же - каждый может сам выбирать для себя авторитетов. Ваш вариант является частным (но более конкретным) вариантом мого.

+0.00 / 0

АУ

nihilist
23 июл 2010 02:20:41 ...

nihilist

23 июл 2010, 02:20:41

Слушатель

Карма: +9.36
Регистрация: 17.09.2007
Сообщений: 556
Читатели: 0

Аккаунт заблокирован

Тред №240188
Дискуссия 466 5

Вы предлагаете некоторое обобщение байесовской сети доверия: в данном случае механизм не гарантирует ни ацикличность, ни объективную экспертность оценки. Смысл идеи - получение некоторой априорной оценки "интересности" источника информации для пользоватля, где автоматический автоматический анализ "интересности" самой информации источника заменяется анализом экспетных оценок, данных этому источнику другими пользователями.

Во-первых, без использования семантических связей система работать не будет. Например, пусть пользователь U0 полностью согласен с пользователем U1 в оценке источника А, и полнотью не согласен в оценке источников B, C, D и т.д. Пусть U0 согласен с пользователем U2 по источнику А на половину, а других оценок U2 вообще не давал. В итоге, либо будет превалировать сомнитльная оценка пользователя U2, либо, если задать для U1 доминирующий вес, его оценки вылезут в вопросах где U0 c ними не согласен.
Скажем, я прислушиваюсь к мнению Гоблина в его оценке комедий, но абсолютно не люблю ужастики, и в этом плане мне его оценки абсолютно безразличны. Простым весовым коэффициентом коллизия не лечится.
Таким образом к каждую пару узлов может соединять множество ребер, из которых должно автоматически выбираться наиболее подходящее, в соответствии с фактической информацией, содержащейся в источнике. А для этого информацию придется автоматически анализировать на соответствие тегам RDF. Хорошо, если источник содержит собственное RDF-описание, а если нет, задача сводится к исходной, т.е. автоматическому анализазу содержимого источника.
Во-вторых, в силу возможности внутренних циклов, система уязвима для манипулирования с позиции грубой силы: "Маша любит мамбу, Саша любит мамбу, следовательно, и Сережа тоже". Т.е. имея ресурс для создания легиона "Маш" и "Саш", активно ссылающихся друг на друга, можно исказить отклик сети до неузнаваемости.

Лично мое мнение - простого выхода нет. Создание "дубля" идея древняя и вкусная, но "дубль" мне представляется в виде персонального для пользователя самомодифицирующегося конечного автомата, для которого только его пользователь и никто больше является единственным источником экспертной оценки.
Т.е. послали такого "томагочи" на ночь в инет что-то искать, и он натаскал оттуда "интересных" ссылок, опираясь на свой алгоритм семантического разбора информации и историю оценок пользователем источников, аналогичных по некоторому набору признаков. Сложно. А что делать?

+0.08 / 1

АУ

Captain Tylor
23 июл 2010 03:30:47 ...

Captain Tylor

23 июл 2010, 03:30:47

Слушатель

Карма: +2.73
Регистрация: 05.10.2008
Сообщений: 513
Читатели: 0

Дискуссия: Тред №240188

Цитата: nihilist от 23.07.2010 02:20:41
Вы предлагаете некоторое обобщение байесовской сети доверия: в данном случае механизм не гарантирует ни ацикличность, ни объективную экспертность оценки. Смысл идеи - получение некоторой априорной оценки "интересности" источника информации для пользоватля, где автоматический автоматический анализ "интересности" самой информации источника заменяется анализом экспетных оценок, данных этому источнику другими пользователями.

Именно. Приятно говорить с человеком "в теме"

Цитата: nihilist от 23.07.2010 02:20:41
Во-первых, без использования семантических связей система работать не будет. Например, пусть пользователь U0 полностью согласен с пользователем U1 в оценке источника А, и полнотью не согласен в оценке источников B, C, D и т.д. Пусть U0 согласен с пользователем U2 по источнику А на половину, а других оценок U2 вообще не давал. В итоге, либо будет превалировать сомнитльная оценка пользователя U2, либо, если задать для U1 доминирующий вес, его оценки вылезут в вопросах где U0 c ними не согласен.

В таком случае вообще не стоит использовать оценки U1 и U0.

Цитата: nihilist от 23.07.2010 02:20:41
Скажем, я прислушиваюсь к мнению Гоблина в его оценке комедий, но абсолютно не люблю ужастики, и в этом плане мне его оценки абсолютно безразличны. Простым весовым коэффициентом коллизия не лечится.

Тут можно разделить Гоблина на несколько Гоблинов - по одному на каждый жанр. Это может сделать либо он сам, либо это делается через автоматических прокси - оценщиков. Хотя да, в таких случаях некоторое усложнение протокола может упростить его использование.

Цитата: nihilist от 23.07.2010 02:20:41
Таким образом к каждую пару узлов может соединять множество ребер, из которых должно автоматически выбираться наиболее подходящее, в соответствии с фактической информацией, содержащейся в источнике. А для этого информацию придется автоматически анализировать на соответствие тегам RDF. Хорошо, если источник содержит собственное RDF-описание, а если нет, задача сводится к исходной, т.е. автоматическому анализазу содержимого источника.

Тут не совсем понял. Вообще, вопрос о применении источника должен приниматься на основе истории его оценок...

Цитата: nihilist от 23.07.2010 02:20:41
Во-вторых, в силу возможности внутренних циклов, система уязвима для манипулирования с позиции грубой силы: "Маша любит мамбу, Саша любит мамбу, следовательно, и Сережа тоже". Т.е. имея ресурс для создания легиона "Маш" и "Саш", активно ссылающихся друг на друга, можно исказить отклик сети до неузнаваемости.

Дегионы Маш - это проблема традиционных голосовалок. В данно схеме такая Маша либо просто не попадет в правила, либо вылетит после таких фокусов. Ну и, конечно, должны быть отсечки по уровню - я решил, что это само собой разумеется:)

Цитата: nihilist от 23.07.2010 02:20:41
Лично мое мнение - простого выхода нет. Создание "дубля" идея древняя и вкусная, но "дубль" мне представляется в виде персонального для пользователя самомодифицирующегося конечного автомата, для которого только его пользователь и никто больше является единственным источником экспертной оценки.
Т.е. послали такого "томагочи" на ночь в инет что-то искать, и он натаскал оттуда "интересных" ссылок, опираясь на свой алгоритм семантического разбора информации и историю оценок пользователем источников, аналогичных по некоторому набору признаков. Сложно. А что делать?

Наверное, я сразу не совсем точно расставил приоритеты... Вообще-то, когда я это придумывал, я имел в виду прежде всего нетривиальные темы, в первую очередь политические, и не столько "интересность", сколько "правдивость". Т.е. цель - не просто "найти что-то интересненькое", а определить, что из кучи информации - чушь, что ложь, что глупость, а что - действительно проверенная и объективная информация. Пусть даже и субъективно объективная. А в этом случае без экспертных оценок не обойтись.

+0.00 / 0

АУ

aeroplane
23 июл 2010 03:37:02 ...

aeroplane

23 июл 2010, 03:37:02

53 года

Слушатель

Карма: +31.00
Регистрация: 06.02.2010
Сообщений: 2,404
Читатели: 0

Дискуссия: Тред №240188

Цитата: nihilist от 23.07.2010 02:20:41
Т.е. послали такого "томагочи" на ночь в инет что-то искать, и он натаскал оттуда "интересных" ссылок, опираясь на свой алгоритм семантического разбора информации и историю оценок пользователем источников, аналогичных по некоторому набору признаков. Сложно. А что делать?

Честно говоря, я как раз думал о том, что бы написать читалку для Авантюры ;)
Просто достало, что темы, которые меня не интересуют забивают важные для меня.
Совет поставить патч не предлагать, так как хочется реализовать сохранение
меморизов поставленных на АУ. Попробую наваять на следующей неделе.

+0.00 / 0

АУ

problemsolver
23 июл 2010 06:11:33 ...

problemsolver

23 июл 2010, 06:11:33

Мценск-Тула-Москва

Слушатель

Карма: +50.28
Регистрация: 14.03.2008
Сообщений: 3,780
Читатели: 0

Аккаунт заблокирован

Дискуссия: Тред №240188

Цитата: aeroplan от 23.07.2010 03:37:02
Честно говоря, я как раз думал о том, что бы написать читалку для Авантюры ;)
Просто достало, что темы, которые меня не интересуют забивают важные для меня.
Совет поставить патч не предлагать, так как хочется реализовать сохранение
меморизов поставленных на АУ. Попробую наваять на следующей неделе.

Я уперся в то, что нельзя скачивать отдельные посты по номеру. Да так что-то и забросили это дело. А вообще я закачал весь форум в феврале в свою базу на фб, со словарем и все такое)

Так же, как тринадцатый удар часов ставит под сомнение предыдущие двенадцать,
так и попытка оболгать меня со стороны так называемого модератора Voyager77 ставит под сомнение его способность модерировать.
И, да, империя - это мир.

+0.00 / 0

АУ

nihilist
23 июл 2010 12:34:37 ...

nihilist

23 июл 2010, 12:34:37

Слушатель

Карма: +9.36
Регистрация: 17.09.2007
Сообщений: 556
Читатели: 0

Аккаунт заблокирован

Дискуссия: Тред №240188

Цитата: Captain Tylor от 23.07.2010 03:30:47
В таком случае вообще не стоит использовать оценки U1 и U0.

А они, заразы, по определению динамические. U0 использовал для оценки U1, а U1 за пол года возял да и скурвился, или его источники скурвились. Т.е. требуется механизм контроля релевантности да еще и по всей цепочке с исключением циклов. Можно, конечно поиграться с затуханием веса оценок в зависимости от длины маршрута до узла: "вассал моего вассала, не совсем мой вассал", но тем не менее проблема налицо.

Цитата
Тут можно разделить Гоблина на несколько Гоблинов - по одному на каждый жанр. Это может сделать либо он сам, либо это делается через автоматических прокси - оценщиков. Хотя да, в таких случаях некоторое усложнение протокола может упростить его использование.
...
Тут не совсем понял. Вообще, вопрос о применении источника должен приниматься на основе истории его оценок...

Абсолютно тоже самое, что "разделить Гоблина" только другими словами: вес ребра определяется в зависимости от контекста, т.е. можно считать, что в кажое дополнительное ребро добавлен промежуточный узел, соединенный с оригинальным "Гоблином" ребром с поправочным для данного контекста весом.

Цитата
Дегионы Маш - это проблема традиционных голосовалок. В данно схеме такая Маша либо просто не попадет в правила, либо вылетит после таких фокусов. Ну и, конечно, должны быть отсечки по уровню - я решил, что это само собой разумеется:)

Задача добиться максимальной популярности произвольного источника инфорамции в средствами сети предлженного типа.
Решение:
1. Вычисляем предпочтения среднестатистического буратино (по определению сети они должны быть публичными) и делаем стопицот тысяч миллионов его клонов с теми же оценками материала. Соединяем их перекрестными ссылками.
2. Буратино ищет своих интеллектуальных собратьев по принципу схожести оценок, и с высокой степенью вероятности находит одного из наших клонов.
3. Модифицируем сеточку, создав у каждого второго клона ссылку на целевой ресурс.
4. Буратино видит: все его собратья по разуму стройными рядами ломанули в одно и тоже место. Значит и ему туда тоже надо.
5. ?????
6. Профит

Цитата
Наверное, я сразу не совсем точно расставил приоритеты... Вообще-то, когда я это придумывал, я имел в виду прежде всего нетривиальные темы, в первую очередь политические, и не столько "интересность", сколько "правдивость". Т.е. цель - не просто "найти что-то интересненькое", а определить, что из кучи информации - чушь, что ложь, что глупость, а что - действительно проверенная и объективная информация. Пусть даже и субъективно объективная. А в этом случае без экспертных оценок не обойтись.

"Что есть истина?" П.Пилат.

Любая экспертная сеть с динамически меняющимся набором неверифицируемых узлов по определению чревата манипуляциями. Яркий пример - Википедия, только там эксперты не читатели, а писатели, но суть дела от этого не меняется: в общем случае, информация, почерпнутая из Википедии, имеет помоечный уровень достоверности.
Это как в играть в преферанс с неизвестными партнерами: при условии, что они играют на один карман и обмениваются информацией, Вы проиграете просто по теории вероятности, без необходимости дополнительных манипуляций с колодой. Единственный гарантированно честный эксперт - это Вы сами, следовательно, автомат выбора должен быть построен целиком на Ваших собственных оценках. Утверждение может быть расширено путем делегирования доверия конкретным, однозначно аутентифицируемым экспертным узлам, но ни о каком обезличенном рейтинге "правдивости" не может быть и речи.

+0.00 / 0

АУ

nihilist
23 июл 2010 19:23:02 ...

nihilist

23 июл 2010, 19:23:02

Слушатель

Карма: +9.36
Регистрация: 17.09.2007
Сообщений: 556
Читатели: 0

Аккаунт заблокирован

Тред №240446
Дискуссия 332 0

Для отделения зерен от плевелл и агнцев от козлищ предложенная схема не годится. Это мое личное мнение. Но из сказанного не следует, что я отрицаю возможность извлечения из данной системы некоторой персональной пользы любым ее пользователем. А если пользу может извлечь каждый без изъятия, то она превращается в общественное благо, которое, по утверждению Цицерона, высший закон.
Пользу извлечь очень просто даже при минимальной модификации существующей системы рейтингования. Достаточно снабжать посты набором тегов (по умолчанию наследуется из темы) и при выдаче оценки указывать к каким именно тегам она относится. И, главное, оценка должна быть именной. Т.е. topic_xxx = {nihilist(TAG_1==-3 && TAG_2==3 && TAG_3 == -2), aeroplan(...),...}
Если очень хочется считать еще и сумму - пусть считают: не суть важно.
Все остальное считается на внешнем движке.
Скажем, каждой паре { автор,набор тегов поста} можно сопоставить множество матриц реакций пользователей, выразивших отношение к данному посту. Очевидно, каждый пост должен снабжаться уникальным тегом, однозначно этот пост определяющим. Дальше можно упражняться в применених любого математического арсенала: хоть линейной алгебры, хоть исчисления графов, хоть чего угодно еще. В результате можно достаточно легко определить, какие именно посты вызывают наиболее сильную позитивную или негативную реакцию аудитории, и какие контекстные зависимости при этом существуют.
Т.е. получаем работоспособную вариацию на тему Мензуры Зоили: авторы и читатели могут составить представление о реакции аудитории на определенные сообщеение. А дальше, сделав предположение об определенной последовательности представлений о предмете, можно качественно прогнозировть реакцию не некоторое синтетическое утвержедение. Возможность внешней манипуляции выборкой естественно, сохраняется: т.е. результат будет верен для множества ников, а не множетсва фактических людей-участников, но что-то всеже лучше, чем совсем ничего.
Если хочется глобальности и охвата произвольных источников, можно создать аналог социальной сети, где пользователи высказываются о любых источниках информации с которыми им пришлось иметь дело, и рейтингуют при этом чужие высказывания на ту же тему. Естественно, такая сеть слабо защищена от сознательных злоупотреблений, но как еще одна разновидность социальной сети, почему бы и нет.

+0.00 / 0

АУ

Captain Tylor
23 июл 2010 22:50:10 ...

Captain Tylor

23 июл 2010, 22:50:10

Слушатель

Карма: +2.73
Регистрация: 05.10.2008
Сообщений: 513
Читатели: 0

Дискуссия: Тред №240188

Цитата: nihilist от 23.07.2010 12:34:37
А они, заразы, по определению динамические. U0 использовал для оценки U1, а U1 за пол года возял да и скурвился, или его источники скурвились. Т.е. требуется механизм контроля релевантности да еще и по всей цепочке с исключением циклов.

Для контроля релевантности как раз и нужны промежуточные звенья. Т.е. конечный пользователь, как правило, не напрямую подсоединяется к оценщикам, а через промежутоные правила "модераторов", которые и занимаются отбраковкой "скурвивишихся" U1 и U2 и добавлением взамен релевантных источников. Пользователю остается только отбраковывать скурвившихся "модераторов".

Цитата: nihilist от 23.07.2010 12:34:37
Решение:
1. Вычисляем предпочтения среднестатистического буратино (по определению сети они должны быть публичными) и делаем стопицот тысяч миллионов его клонов с теми же оценками материала. Соединяем их перекрестными ссылками.
2. Буратино ищет своих интеллектуальных собратьев по принципу схожести оценок, и с высокой степенью вероятности находит одного из наших клонов.
3. Модифицируем сеточку, создав у каждого второго клона ссылку на целевой ресурс.
4. Буратино видит: все его собратья по разуму стройными рядами ломанули в одно и тоже место. Значит и ему туда тоже надо.
5. ?????
6. Профит"Что есть истина?" П.Пилат.

Пункт 5. - буратино видит, что в том месте голяк и выносит дезинформаторов из своих референсов навсегда. Еще можно стараться не добавлять в референсы тех, кто не обосновывает и не комментирует свои правила и оценки.

Цитата: nihilist от 23.07.2010 12:34:37
Любая экспертная сеть с динамически меняющимся набором неверифицируемых узлов по определению чревата манипуляциями. Яркий пример - Википедия, только там эксперты не читатели, а писатели, но суть дела от этого не меняется: в общем случае, информация, почерпнутая из Википедии, имеет помоечный уровень достоверности.

Каждый конкретный "нейрон"-правило имеет конкретный набор входов от совершенно определенных источников. И изменить это может только хозяин этого узла. Да, кто угодно может добавлять оценки или правила, но он не может заставить ими пользоваться.

И да, получившийся результат верифицируем. Предполагается, что хозяин узла в состоянии, приложив определенные усилия, проверить результаты его работы. И уточнять правила в зависимости от результатов. Цель - не отключить мозг, а позволить его более эффективно использовать. Грубо говоря, сократить количество необходимых интеллектуальных проверок на один из тысячи.

Цитата: nihilist от 23.07.2010 12:34:37
Это как в играть в преферанс с неизвестными партнерами: при условии, что они играют на один карман и обмениваются информацией, Вы проиграете просто по теории вероятности, без необходимости дополнительных манипуляций с колодой.

Традиционные "закрытые" системы, вроде Гугла или Вики - это и есть преферанс с неизвестно кем. Причем практически без возможности выбора. И более того, в случае Гугла, например, приходится играть, зная, что они делают деньги на том, что подтасовывают результаты в интересах рекламодателей.

Цитата: nihilist от 23.07.2010 12:34:37
Единственный гарантированно честный эксперт - это Вы сами, следовательно, автомат выбора должен быть построен целиком на Ваших собственных оценках. Утверждение может быть расширено путем делегирования доверия конкретным, однозначно аутентифицируемым экспертным узлам, но ни о каком обезличенном рейтинге "правдивости" не может быть и речи.

Именно так. Это собственно и есть основные принципы описываемой системы - конечный пользователь как единственный абсолютный авторитет, субъективность "правды", делегирование доверия кокнкретным экспертным узлам.
То, что экспертные узлы могут в свою очередь также делегировать доверие другим узлам не делает их менее "конретными" - они все равно отвечают за результат своей репутацией.

+0.00 / 0

АУ