Структура дерева знаний
135,681 390
 

  ConstB ( Слушатель )
17 дек 2017 19:35:41

Структура дерева дискуссий

новая дискуссия Дискуссия  724

Подниму-ка я тему структурирования дерева дискуссий на ГА.

То что здесь обсуждалось когда-то Авантюристом ранее, давно уже не работает и не актуально. На текущий момент структура дискуссий у нас отражена в ветках форума. Но отражена коряво, непонятно и зачастую с дублированием. Иногда бывает непонятно где-что публиковать. Предлагаю прояснить текущую структуру дерева дискуссий и сопоставить с названиями веток форума.

Думаю, что нужно пройтись по разделам и идентифицировать дискурс каждой ветки. Что-то можно объединить, что-то выделить отдельно. В результате вывесить где-нибудь в качестве указателя-путеводителя, чтобы всем было понятно что-где обсуждается.

Просьба заинтересованным комрадам поучаствовать.

Например, как это могло бы выглядеть:

ЭКОНОМИЧЕСКИЙ РАЗДЕЛ

...

ПОЛИТИЧЕСКИЙ РАЗДЕЛ

Геополитика (Большой передел мира)
---- Украина (Украинско-российский отношения)
---- КНДР (Напряженность на корейском полуострове)
---- ...
Россия (Перспективы развития России) - можно переименовать ветку как общую по России
---- Внутренняя политика (Выбор России: текущая политическая ситуация)
---- ...

Важно учитывать:
* Структура относится к тредам;
* Тред можно будет публиковать в нескольких ветках (дискурсах). Например, создавая тред через новую кнопку "написать", публикацию в форуме можно будет делать выбирая в указателе дискурсов (а не заголовков веток), что на мой взгляд гораздо удобнее;
* Ветка (дискурс) может быть процессом или событием;
* Структура дискурсов будет часто меняться, исходя из появления новых процессов и событий;

Прикреплю и буду дополнять.
Отредактировано: ConstB - 17 дек 2017 19:48:10
  • +0.11 / 2
  • АУ
ОТВЕТЫ (11)
 
 
  slavae ( Слушатель )
17 дек 2017 20:20:18


Чё-то сложновато выходит. Не покатит, мне кажется.
  • -0.08 / 2
  • АУ
 
 
  ConstB ( Слушатель )
17 дек 2017 20:51:26


Что сложного? Описать дискурс для каждой ветки в одно-двух-трех словах о чем она. И выстроить дерево. Что-то можно взять из дерева Авантюриста, что еще актуально.
  • +0.62 / 3
  • АУ
 
 
 
  slavae ( Слушатель )
17 дек 2017 21:27:06

А, вот тут уже по-человечески написано )
  • +0.00 / 0
  • АУ
 
  ахмадинежад ( Слушатель )
19 дек 2017 16:11:52

ещё нужен социологический раздел, до кучи к историческомуУлыбающийся
  • +0.84 / 6
  • АУ
 
 
  ConstB ( Слушатель )
19 дек 2017 16:17:07


Я, в отличии от идеи Авантюриста, хочу выстроить дерево исходя из наработанного на практике, т.е. из тех веток что сейчас есть, а не создавать структуру впереди дискуссий. Если есть ветки на социологическую тему, то можно объединить в раздел.

Кстати, ахмади, хороший момент для объединения веток!
  • +0.38 / 2
  • АУ
 
 
 
  ахмадинежад ( Слушатель )
19 дек 2017 16:44:39

так в том -то и дело, что их валом и распиханы во существующим
ещё к примеру наверно надо сделать завалинку/хобби/интересы ...

Улыбающийся
  • +1.02 / 9
  • АУ
 
 
 
  normalized_ ( Слушатель )
19 дек 2017 21:34:45

Что-то все равно без выстроенного вручную дерева у меня не получается.

В качестве примера, (чтоб понять что нужно сделать, а то не понятно все равно) попробовал расставить тэги по некоторым веткам для "Политического раздела" (которые обновлялись в этом разделе за последние 2 года):
  • Есть список веток в виде файла csv, который открывается обычным редактором таблиц. Для некоторых веток политического раздела добавлены тэги (в крайние правые столбцы tag1 tag2 tag3) : topics_all.csv. То есть человек с ним работает и расставляет тэги.

  • Для того чтобы оценить что получается, как раскидываются ветки генерируется вьюшка, вот как раз для этого понадобилось дерево tree.md (составлено человеком), в котором тэги расставлены иерархически ручками. (возможна сериализация и десериализация в  csv)

  • С помощью двух этих исходных файлов после проверки соответствия тэгов сгенерирован (check.ipynb) пример view-шки, что получается: topics_generated.md



Вопросы и неясности:
  • Что дальше? Что должно получиться в итоге? Правильное ли направление движения?

  • 'дерево тэгов' (в моем понимании) == 'указатель дискурсов' или есть нюансы?

  • Как я понял из выше написанных сообщений: так как к ветке могут быть привязаны несколько тэгов, то ветка может одновременно попасть в несколько каталогов (Например Донбасс - его жизнь и судьба попадает и к России и к Украине).

  • Как я понял из выше написанных сообщений: К каталогу, например "Россия", может быть привязана ветка (например ПРР), но только одна. (добавить столбец в csv файл? или как?)

  • Пока что в рамках раздела, в дереве, тэги уникальны. То есть тэг США в "Политическом разделе" может быть в дереве только не более одного раза (а ведь можно придумать случаи, когда потребуется чтоб какой-то тэг в дереве встречался более одного раза)



А вот чтобы строить иерархию автоматически исходя из наработанного без дерева, то есть только на основе main_topics.csv ( + названия, тэгов, и, например, на основе текста первых двадцати сообщений и других данных), то нужно что-то типа тематического моделирования (рекомендую просмотреть лекцию) которое поддерживает динамику, или что-то еще. Но это пока сложно.

Теперь насчет workflow.
Если хотя бы на 50% направление верно (но после обсуждения), то можно брать/скачивать .csv файлы и пробовать дальше расставлять теги, можно форкиться или пулриквестивать. Расставить тэги ко всем веткам я, конечно, не смогу (о ветках и представления-то не имею, кто и что там чего обсуждал или обсуждает), Особенно много топиков на "Пользовательских разделах" (половина веток, 800 из 1600) понятно что все ветки пока не нужно и некоторые старые, но все таки желательно охватить (так как потом возможно будет обучение, чтоб автоматически классифицировать документ). Начать, кмк, для примера лучше с двух-трех разделов (чтоб учесть проблему общих тем между разделами).

Для оценки времени: всего веток на форуме 1596, включая заблокированные, если на каждую (а каждую не нужно) тратить 5-10 секунд, то тэгирование займет  2-4 часа. Соответственно создается файл дерева tree.md (одновременно, а может быть и раньше, а может быть и позже).

И все равно, до конца не понимаю результат и зачем все это нужно. Самое непонятное куда отнести ветку "Путин" которая на пользовательских, как протэгировать понятно.
  • +0.24 / 3
  • АУ
 
 
 
 
  ахмадинежад ( Слушатель )
20 дек 2017 13:15:16

для Путина создать раздел - "культ личности" :)
и туда про Путина, Сталина, Ленина, Грозного, Всеволода Большое гнездо ... Веселый
  • +0.82 / 7
  • АУ
 
 
 
 
 
  normalized_ ( Слушатель )
20 дек 2017 20:38:20

Пока просто "Личности" ( для примера), но он еще в пользовательских (как "пользователь" Веселый, то есть в корне дерева)
Для оперативной вьюшки - дерево на яваскрипте c раскрытием по тэгу, например: Путин, Сталин
США в трех местах, Украина тоже военно-политическая-пользовательская.
В csv набил тэги пока для трех разделов (очень грубо, для примера, ориентируясь только по названию веток, не все ветки).
  • +0.18 / 2
  • АУ
 
 
 
 
 
  Удаленный пользователь
04 янв 2018 15:47:51
Сообщение удалено
Маликар
04 янв 2018 20:01:03
Отредактировано: Маликар - 04 янв 2018 20:01:03

  • +0.00
 
 
 
 
 
 
  slavae ( Слушатель )
04 янв 2018 17:26:19
Сообщение удалено

04 янв 2018 21:31:04

  • +0.00