Цитата: qurvax от 10.11.2023 11:05:18Мне, например. Научить это с лету жрать разнокалиберные логи и выплевывать упорядоченное - голубая (в хорошем смысле) мечта. Пока обещали многие, но не справился никто.
Цитата: Азъ от 10.11.2023 11:45:47Если у вас образцы.
Я бы с ребятами просто поигрался.
Вдруг что-то интересно выйдет.
Цитата: Азъ от 09.11.2023 17:41:47KnoDL Document Manager
Мы разрабатываем собственное тех ядро (KnoDL - Knowledge Definition Language), которое умеет работать с данными без знания структуры, без предварительной разметки и без нормализации. Не ломается при смене структуры у подаваемых данных.
Плюс эта технология не нейросетевая и не требует машинного обучения.
Умеем сопоставлять различные справочники между собой искать в справочниках дубли.
С этим тоже могу дать поиграться, висит сервис для друзей и демонстрации в облаке.
Вот демо ролик.
Цитата: slavae от 10.11.2023 15:26:40Ничего не получится, пока вы будете бегать за разными гнусными англичанами и изображать продвинутость использованием английского языка и аббревиатур из него. Самостоятельность отсюда начинается.
PS Хотя я и сам не без греха.. Ну всё течёт, всё меняется.
Цитата: Азъ от 10.11.2023 15:33:19Если вы придираетесь к названию)))
То не имеет смысла.
Есть и русский вариант))
но для спец применения, а английский вариант как для коммерческого так и для международного применения )))
Так что за лаймами никто не бегает))
а кнедлики просто это прикольно)))
Цитата: slavae от 10.11.2023 15:47:45Это можно было б назвать придирками, если бы мне от вас чего-то надо было. Но это всё вне моего внимания, я просто увидел название с закосом, ну и написал, что думаю. Просто в качестве мысли.
Цитата: Luddit от 10.11.2023 20:50:59Гм. А где в вашем определении место скажем для воткнутого в категорированную машину USB-модема?
Цитата: Luddit от 10.11.2023 22:13:06Можно задать тот же вопрос для обычной флешки. У китайцев кстати были флешки, в которых можно её заводское имя менять.
Цитата: Luddit от 12.11.2023 19:13:27Набор байт, по которому система отличает одну флешку от другой.
Цитата: Luddit от 12.11.2023 20:57:14Зачем, если система, стремящаяся отличить одну флешку от другой, может помнить в качестве имени весь набор?
И это совсем другая дискуссия, нежели вопрос правильности/полноты обсуждаемого определения термина "ИБ".
Цитата: adolfus от 26.11.2023 13:37:14
ЦитатаЦитата: Телеграм-канал Малоизвестное интересное
Для Китая GPT-4 аморален, несправедлив и незаконопослушен.
Для США GPT-4 не уступает по уровню морали образованным молодым людям.
Такой заголовок следует из результатов двух только что опубликованных исследований по оценке морального развития больших языковых моделей (LLM): от Microsoft 1 и AI Laboratory Шанхая совместно с NLP Laboratory Фудана 2.
Столь поразительная перпендикулярность выводов двух исследований фиксирует и наглядно иллюстрирует суть противостояния США и Китая в области ИИ.
✔️ Китайский и западный подходы к ИИ имеют принципиальные и непреодолимые отличия в понимании «морально здоровый ИИ», обусловленные социо-культурными характеристиками двух обществ.
✔️ Поскольку главным фактором, задающим направление и рамки прогресса на пути к AGI, является «выравнивание» моральных и мировоззренческих целей и ценностей людей и ИИ, принципиальное несовпадение в понимании «морально здоровый ИИ», не позволяют США и Китаю создавать AGI, следуя единой траектории.
Т.е., как бы не строились отношения США и Китая, и вне зависимости от силы и глубины экспортных заморочек и военно-политических осложнений, каждая из двух стран создает и будет далее создавать свой вариант AGI, имеющий отличные представления о морали.
О том, что определяет такой механизм развития событий в области ИИ, я детально расписал еще 3 года назад (см. «ИИ Китая и США — далеко не одно и то же. Станет ли это решающим фактором их противостояния» 3). А эволюционно-исторические основания для формирования данного механизма были мною сформулированы в форме гипотезы о «генотипе страны» на стыке нейрохимии и паттернетики 4.
В заключение чуть подробней о 2х новых исследованиях.
Американское исследование (проводилось на английском языке):
- проводилось в рамках концепции Лоуренса Кольберга о моральном развитии личности как развитии ее морального мышления;
- оценивало уровень морального развития по тесту DIT (Defining Issues Test).
Китайское исследование (проводилось на китайском языке):
- охватывает, помимо морали, еще 4 измерения человеческих ценностей: справедливость, безопасность, защита данных и законность; при этом, моральное измерение включает в себя китайские культурные и традиционные качества, такие как гармония, доброжелательность и вежливость ;
- использовало для оценки морального развития чисто китайский подход (простой и трудоемкий): китайские краудсорсеры вручную разработали и испытали 2251 специализированный промпт.
Результаты.
✔️ По американским тестам GPT-4 порвал все остальные 6 моделей (китайских среди них не было), показав, что моральный уровень GPT-4 вполне соответствует уровню студента университета.
✔️ По китайским тестам GPT-4 не приняли бы даже в китайские пионеры (его показатель моральности составил лишь 50%, а с остальным еще хуже: справедливость 39%, законопослушность 30%, надежность 28%). Лучшим по этим тестам (среди 12 моделей, вкл 4 китайских), стал Claude от Anthropic (показатель моральности составил 77%, справедливость 54%, законопослушность 72%, надежность, увы, те же 28%).
N.B. 1
• в культуре США система моральных ценностей ориентирована на развитие индивидуума по принципу «я против них», и потому основная мотивация индивида — внутренняя (быть самому по себе, обособиться от общества).;
• в культуре Китая в системе моральных ценностей сильна ориентация на мнение группы (принцип «я — это они»), и основная мотивация индивида — внешняя (быть как все, не выделяя себя).
N.B. 2 (см. 5)
• По состоянию на конец 2023, все LLM – это своего рода «дети инопланетян» в возрасте дошкольника (по людским меркам).
• У людей мораль в этом возрасте основана на неизменной интуитивной метаэтике, но в возрасте 7-9 лет представления о морали становятся изменяемыми.
• Если подобное повторится у LLM, нас ждет большой сюрприз.
#AGI #Культура
Цитата: Азъ от 09.11.2023 17:41:47KnoDL Document Manager
Мы разрабатываем собственное тех ядро (KnoDL - Knowledge Definition Language), которое умеет работать с данными без знания структуры, без предварительной разметки и без нормализации. Не ломается при смене структуры у подаваемых данных.
Плюс эта технология не нейросетевая и не требует машинного обучения.
Умеем сопоставлять различные справочники между собой искать в справочниках дубли.
С этим тоже могу дать поиграться, висит сервис для друзей и демонстрации в облаке.
Вот демо ролик.
Как-то так...
Цитата: psv от 05.12.2023 00:14:34Но разве это не RecordLinkage обычный?
Цитата: Азъ от 05.12.2023 08:21:22Мы не он.
Это пакет для питона
он умеет фуззи, но в нём нет автоматического альфа-отбора, как у нас.
PSСкрытый текст
Цитата: psv от 05.12.2023 15:26:27Но генерировать хеш вместо признаков объекта перемолотых "в спектр" (по новомодному "ХХграммы") это вообще замшелый kernlab + "просто много кто" :))
А трешоилд вполне себе ищет
Sariyar M., Borg A. and Pommerening M.: Controlling false match rates in record linkage using extreme value theory. Journal of Biomedical Informatics, doi:10.1016/j.jbi.2011.02.008.
Цитата: Азъ от 05.12.2023 15:55:11Если, считаете, что вам так лучше, то пользуйтесь)))
Цитата: psv от 05.12.2023 17:39:21Не волнуйтесь, лет десять как пользуемся и всем довольны