Дискуссия Новая 496 Тред №240188 23 июл 2010 в 02:20 nihilist
Ветка: Открытая производная субъективная оценка Вы предлагаете некоторое обобщение байесовской сети доверия: в данном случае механизм не гарантирует ни ацикличность, ни объективную экспертность оценки. Смысл идеи - получение некоторой априорной оценки "интересности" источника информации для пользоватля, где автоматический автоматический анализ "интересности" самой информации источника заменяется анализом экспетных оценок, данных этому источнику другими пользователями. Во-первых, без использования семантических связей система работать не будет. Например, пусть пользователь U0 полностью согласен с пользователем U1 в оценке источника А, и полнотью не согласен в оценке источников B, C, D и т.д. Пусть U0 согласен с пользователем U2 по источнику А на половину, а других оценок U2 вообще не давал. В итоге, либо будет превалировать сомнитльная оценка пользователя U2, либо, если задать для U1 доминирующий вес, его оценки вылезут в вопросах где U0 c ними не согласен. Скажем, я прислушиваюсь к мнению Гоблина в его оценке комедий, но абсолютно не люблю ужастики, и в этом плане мне его оценки абсолютно безразличны. Простым весовым коэффициентом коллизия не лечится. Таким образом к каждую пару узлов может соединять множество ребер, из которых должно автоматически выбираться наиболее подходящее, в соответствии с фактической информацией, содержащейся в источнике. А для этого информацию придется автоматически анализировать на соответствие тегам RDF. Хорошо, если источник содержит собственное RDF-описание, а если нет, задача сводится к исходной, т.е. автоматическому анализазу содержимого источника. Во-вторых, в силу возможности внутренних циклов, система уязвима для манипулирования с позиции грубой силы: "Маша любит мамбу, Саша любит мамбу, следовательно, и Сережа тоже". Т.е. имея ресурс для создания легиона "Маш" и "Саш", активно ссылающихся друг на друга, можно исказить отклик сети до неузнаваемости. Лично мое мнение - простого выхода нет. Создание "дубля" идея древняя и вкусная, но "дубль" мне представляется в виде персонального для пользователя самомодифицирующегося конечного автомата, для которого только его пользователь и никто больше является единственным источником экспертной оценки. Т.е. послали такого "томагочи" на ночь в инет что-то искать, и он натаскал оттуда "интересных" ссылок, опираясь на свой алгоритм семантического разбора информации и историю оценок пользователем источников, аналогичных по некоторому набору признаков. Сложно. А что делать? +0.08 / 1
АУ

Дискуссия Новая 496

Тред №240188

23 июл 2010 в 02:20 nihilist

Ветка: Открытая производная субъективная оценка

Вы предлагаете некоторое обобщение байесовской сети доверия: в данном случае механизм не гарантирует ни ацикличность, ни объективную экспертность оценки. Смысл идеи - получение некоторой априорной оценки "интересности" источника информации для пользоватля, где автоматический автоматический анализ "интересности" самой информации источника заменяется анализом экспетных оценок, данных этому источнику другими пользователями.

Во-первых, без использования семантических связей система работать не будет. Например, пусть пользователь U0 полностью согласен с пользователем U1 в оценке источника А, и полнотью не согласен в оценке источников B, C, D и т.д. Пусть U0 согласен с пользователем U2 по источнику А на половину, а других оценок U2 вообще не давал. В итоге, либо будет превалировать сомнитльная оценка пользователя U2, либо, если задать для U1 доминирующий вес, его оценки вылезут в вопросах где U0 c ними не согласен.
Скажем, я прислушиваюсь к мнению Гоблина в его оценке комедий, но абсолютно не люблю ужастики, и в этом плане мне его оценки абсолютно безразличны. Простым весовым коэффициентом коллизия не лечится.
Таким образом к каждую пару узлов может соединять множество ребер, из которых должно автоматически выбираться наиболее подходящее, в соответствии с фактической информацией, содержащейся в источнике. А для этого информацию придется автоматически анализировать на соответствие тегам RDF. Хорошо, если источник содержит собственное RDF-описание, а если нет, задача сводится к исходной, т.е. автоматическому анализазу содержимого источника.
Во-вторых, в силу возможности внутренних циклов, система уязвима для манипулирования с позиции грубой силы: "Маша любит мамбу, Саша любит мамбу, следовательно, и Сережа тоже". Т.е. имея ресурс для создания легиона "Маш" и "Саш", активно ссылающихся друг на друга, можно исказить отклик сети до неузнаваемости.

Лично мое мнение - простого выхода нет. Создание "дубля" идея древняя и вкусная, но "дубль" мне представляется в виде персонального для пользователя самомодифицирующегося конечного автомата, для которого только его пользователь и никто больше является единственным источником экспертной оценки.
Т.е. послали такого "томагочи" на ночь в инет что-то искать, и он натаскал оттуда "интересных" ссылок, опираясь на свой алгоритм семантического разбора информации и историю оценок пользователем источников, аналогичных по некоторому набору признаков. Сложно. А что делать?

+0.08 / 1

АУ

Предыдущая дискуссия:

<< Тред №240187

Следующая дискуссия:

Тред №240189 >>

ОТВЕТЫ (5)

	Captain Tylor ( Слушатель )
	23 июл 2010 в 03:30

Цитата: nihilist от 23.07.2010 02:20:41

Именно. Приятно говорить с человеком "в теме"

Цитата: nihilist от 23.07.2010 02:20:41

В таком случае вообще не стоит использовать оценки U1 и U0.

Цитата: nihilist от 23.07.2010 02:20:41

Тут можно разделить Гоблина на несколько Гоблинов - по одному на каждый жанр. Это может сделать либо он сам, либо это делается через автоматических прокси - оценщиков. Хотя да, в таких случаях некоторое усложнение протокола может упростить его использование.

Цитата: nihilist от 23.07.2010 02:20:41

Тут не совсем понял. Вообще, вопрос о применении источника должен приниматься на основе истории его оценок...

Цитата: nihilist от 23.07.2010 02:20:41

Дегионы Маш - это проблема традиционных голосовалок. В данно схеме такая Маша либо просто не попадет в правила, либо вылетит после таких фокусов. Ну и, конечно, должны быть отсечки по уровню - я решил, что это само собой разумеется:)

Цитата: nihilist от 23.07.2010 02:20:41

Наверное, я сразу не совсем точно расставил приоритеты... Вообще-то, когда я это придумывал, я имел в виду прежде всего нетривиальные темы, в первую очередь политические, и не столько "интересность", сколько "правдивость". Т.е. цель - не просто "найти что-то интересненькое", а определить, что из кучи информации - чушь, что ложь, что глупость, а что - действительно проверенная и объективная информация. Пусть даже и субъективно объективная. А в этом случае без экспертных оценок не обойтись.

+0.00 / 0

АУ

	nihilist ( Слушатель )
	23 июл 2010 в 12:34

Цитата: Captain Tylor от 23.07.2010 03:30:47

А они, заразы, по определению динамические. U0 использовал для оценки U1, а U1 за пол года возял да и скурвился, или его источники скурвились. Т.е. требуется механизм контроля релевантности да еще и по всей цепочке с исключением циклов. Можно, конечно поиграться с затуханием веса оценок в зависимости от длины маршрута до узла: "вассал моего вассала, не совсем мой вассал", но тем не менее проблема налицо.

Цитата
Тут можно разделить Гоблина на несколько Гоблинов - по одному на каждый жанр. Это может сделать либо он сам, либо это делается через автоматических прокси - оценщиков. Хотя да, в таких случаях некоторое усложнение протокола может упростить его использование.
...
Тут не совсем понял. Вообще, вопрос о применении источника должен приниматься на основе истории его оценок...

Абсолютно тоже самое, что "разделить Гоблина" только другими словами: вес ребра определяется в зависимости от контекста, т.е. можно считать, что в кажое дополнительное ребро добавлен промежуточный узел, соединенный с оригинальным "Гоблином" ребром с поправочным для данного контекста весом.

Цитата
Дегионы Маш - это проблема традиционных голосовалок. В данно схеме такая Маша либо просто не попадет в правила, либо вылетит после таких фокусов. Ну и, конечно, должны быть отсечки по уровню - я решил, что это само собой разумеется:)

Задача добиться максимальной популярности произвольного источника инфорамции в средствами сети предлженного типа.
Решение:
1. Вычисляем предпочтения среднестатистического буратино (по определению сети они должны быть публичными) и делаем стопицот тысяч миллионов его клонов с теми же оценками материала. Соединяем их перекрестными ссылками.
2. Буратино ищет своих интеллектуальных собратьев по принципу схожести оценок, и с высокой степенью вероятности находит одного из наших клонов.
3. Модифицируем сеточку, создав у каждого второго клона ссылку на целевой ресурс.
4. Буратино видит: все его собратья по разуму стройными рядами ломанули в одно и тоже место. Значит и ему туда тоже надо.
5. ?????
6. Профит

Цитата
Наверное, я сразу не совсем точно расставил приоритеты... Вообще-то, когда я это придумывал, я имел в виду прежде всего нетривиальные темы, в первую очередь политические, и не столько "интересность", сколько "правдивость". Т.е. цель - не просто "найти что-то интересненькое", а определить, что из кучи информации - чушь, что ложь, что глупость, а что - действительно проверенная и объективная информация. Пусть даже и субъективно объективная. А в этом случае без экспертных оценок не обойтись.

"Что есть истина?" П.Пилат.

Любая экспертная сеть с динамически меняющимся набором неверифицируемых узлов по определению чревата манипуляциями. Яркий пример - Википедия, только там эксперты не читатели, а писатели, но суть дела от этого не меняется: в общем случае, информация, почерпнутая из Википедии, имеет помоечный уровень достоверности.
Это как в играть в преферанс с неизвестными партнерами: при условии, что они играют на один карман и обмениваются информацией, Вы проиграете просто по теории вероятности, без необходимости дополнительных манипуляций с колодой. Единственный гарантированно честный эксперт - это Вы сами, следовательно, автомат выбора должен быть построен целиком на Ваших собственных оценках. Утверждение может быть расширено путем делегирования доверия конкретным, однозначно аутентифицируемым экспертным узлам, но ни о каком обезличенном рейтинге "правдивости" не может быть и речи.

+0.00 / 0

АУ

	Captain Tylor ( Слушатель )
	23 июл 2010 в 22:50

Цитата: nihilist от 23.07.2010 12:34:37

Для контроля релевантности как раз и нужны промежуточные звенья. Т.е. конечный пользователь, как правило, не напрямую подсоединяется к оценщикам, а через промежутоные правила "модераторов", которые и занимаются отбраковкой "скурвивишихся" U1 и U2 и добавлением взамен релевантных источников. Пользователю остается только отбраковывать скурвившихся "модераторов".

Цитата: nihilist от 23.07.2010 12:34:37

Пункт 5. - буратино видит, что в том месте голяк и выносит дезинформаторов из своих референсов навсегда. Еще можно стараться не добавлять в референсы тех, кто не обосновывает и не комментирует свои правила и оценки.

Цитата: nihilist от 23.07.2010 12:34:37

Каждый конкретный "нейрон"-правило имеет конкретный набор входов от совершенно определенных источников. И изменить это может только хозяин этого узла. Да, кто угодно может добавлять оценки или правила, но он не может заставить ими пользоваться.

И да, получившийся результат верифицируем. Предполагается, что хозяин узла в состоянии, приложив определенные усилия, проверить результаты его работы. И уточнять правила в зависимости от результатов. Цель - не отключить мозг, а позволить его более эффективно использовать. Грубо говоря, сократить количество необходимых интеллектуальных проверок на один из тысячи.

Цитата: nihilist от 23.07.2010 12:34:37

Традиционные "закрытые" системы, вроде Гугла или Вики - это и есть преферанс с неизвестно кем. Причем практически без возможности выбора. И более того, в случае Гугла, например, приходится играть, зная, что они делают деньги на том, что подтасовывают результаты в интересах рекламодателей.

Цитата: nihilist от 23.07.2010 12:34:37

Именно так. Это собственно и есть основные принципы описываемой системы - конечный пользователь как единственный абсолютный авторитет, субъективность "правды", делегирование доверия кокнкретным экспертным узлам.
То, что экспертные узлы могут в свою очередь также делегировать доверие другим узлам не делает их менее "конретными" - они все равно отвечают за результат своей репутацией.

+0.00 / 0

АУ

	aeroplane ( Слушатель )
	23 июл 2010 в 03:37

Цитата: nihilist от 23.07.2010 02:20:41

Честно говоря, я как раз думал о том, что бы написать читалку для Авантюры ;)
Просто достало, что темы, которые меня не интересуют забивают важные для меня.
Совет поставить патч не предлагать, так как хочется реализовать сохранение
меморизов поставленных на АУ. Попробую наваять на следующей неделе.

+0.00 / 0

АУ

	problemsolver ( Слушатель )
	23 июл 2010 в 06:11

Цитата: aeroplan от 23.07.2010 03:37:02

Я уперся в то, что нельзя скачивать отдельные посты по номеру. Да так что-то и забросили это дело. А вообще я закачал весь форум в феврале в свою базу на фб, со словарем и все такое)

+0.00 / 0

АУ