Цитата: AndreyK-AV от 17.03.2019 20:45:20С одной стороны это так, а с другой стороны победа ИИ над человеком в ГО, это именно победа ИИ, там без самообучения никак.
Работа ПО по обработке СМИ и выборка нужного контента, оценка его это уже не просто выбор из заложенного, а формирование понимания контента и его направленность. .
Цитата: rommel.lst от 17.03.2019 21:00:26Не, не согласен. Любая игра - это решение задачи достижения цели при минимуме затрат. Правила четко прописаны, задача формализована. Сложные игры отличаются от простых только числом и весом различных факторов. Причем во многих играх вес факторов может меняться при развитии ситуации. Но это в любом случае остается удобнейшей задачей для НС. Нет тут никакого ИИ.
Если раньше шахматные программы тупо перебирали ветки готовых решений, которые в них закладывали, то теперь НС просто играет куда тоньше.. Вот, только выйти за рамки правил она не может. В принципе.
Цитата: AndreyK-AV от 17.03.2019 20:45:20С одной стороны это так, а с другой стороны победа ИИ над человеком в ГО, это именно победа ИИ, там без самообучения никак.
Работа ПО по обработке СМИ и выборка нужного контента, оценка его это уже не просто выбор из заложенного, а формирование понимания контента и его направленность. .
Цитата: Поверонов от 17.03.2019 21:30:57Не очевидно. Поскольку компьютер может располагать походовыми записями миллионов партий лучших игроков с известным их итогом, то он может находить в своей памяти наилучший возможный ход в сходной ситуации с размытым критерием "улучшения" позиции, выработанным на основе известных ему партий. Самообучение в таком случае не просматривается.
Самообучение случится если компьютер будет миллионы раз играть сам с собой, присоединяя каждую сыгранную таким образом партию к обучающей последовательности.
Понятно, что если игровая среда полностью формализована ( то есть может быть однозначно воспроизведена по записи ), то преимущество имеет тот кто накопил в ней больший опыт. Человек безусловно не в состоянии проиграть такое же множество партий которое может проиграть компьютер.
ЦитатаСогласно DeepMind, AlphaZero использует поиск по дереву Монте-Карло и изучает около 60 000 позиций в секунду, по сравнению с 60 миллионами для Stockfish.
Цитата: slavae от 17.03.2019 22:03:11АльфаЗеро не хранит миллиарды партий, что интересно. Даже после игры миллионов партий. Он оценивает позицию именно на основе того, как выглядит позиция. Он не рассматривает все варианты развития, а только выгодные.
Здесь статья.
Цитата: Поверонов от 17.03.2019 22:54:25Ему и не нужно хранить каждую партию - достаточно на опыте миллионов партий выработать многофакторную функцию оценки следующего хода. Но записи партий должны быть от лучших игроков. Если обучать ИИ на партиях слабых игроков, то на таком уровне он и будет играть.
Цитата: Foxhound от 17.03.2019 23:25:54А человек? Или речь о том, что ИИ по вашему не может учиться на собственных партиях с противниками, корректирую функцию оценки? В общем виде "цикл" гипотеза - проверка - изменение, если выполнены определенные условия.
Цитата: Поверонов от 17.03.2019 23:49:53В формализованных средах где выигрыш определяется однозначно, ИИ может учиться на собственных партиях, если первоначально играет с более опытным противником.
Цитата: Поверонов от 17.03.2019 23:49:53( При игре сам с собой с начала он скорее всего застрянет на детском мате ).
Цитата: Поверонов от 17.03.2019 23:49:53Поднабравшись опыта ИИ сможет уже самообучаться играя со своим клоном.
Цитата: Поверонов от 17.03.2019 23:49:53В данном случае самобучение становится возможным только потому что результат - выигрыш/проигрыш формализован правилами игры, чем реализуется обратная связь.
Цитата: Поверонов от 17.03.2019 23:49:53В других задачах, где обратная связь не может быть формализована, ИИ не способен самообучаться, так как результат его выбора может быть оценен лишь экспертом-человеком. Но в таком случае ИИ и не может обучаться быстро, разве что задействуя одновременно много экспертов.
Цитата: Foxhound от 17.03.2019 23:58:11Как и человек
Не факт, если ходы при застревании делать даже случайным образом и запоминать лучшее.
Это уже человек не сможет.
1) У человека также формализован ряд базовых установок (целей), за счет чего и реализуется обратная связь.
2) Как и человек не может самообучаться, если не поставлена цель и критерии успеха (та самая формализация). Тысячи лет истории человечества до начала НТР не дадут соврать.
Цитата: Поверонов от 18.03.2019 00:25:031) Цели человека встроены природой в форме цепочки биохимических реакций завершающихся выработкой серотонина. ( Отсюда и наркомания - искусственное закорачивание такой цепочки привнесенными химическими компонентами ).
Рациональное мышление вроде бы позволяет формализовать некоторые цели человеческой деятельности, но и то скорее на уровне гипотез ( не факт что их достижение выразится в "тоннах" серотонина у всех соучастников ). Но большая часть человеческой деятельности стимулируется смутными желаниями, корни которых ведут к тому же серотонину.
Цитата: Поверонов от 18.03.2019 00:25:032) см. 1)
Цитата: Foxhound от 18.03.2019 00:41:12Это просто формулировка того же самого на языке химии. Ключевое то, что на архитектурном уровне эти цели прописаны. Рациональное мышление это выход за установленные по умолчанию цели и формулировка новых. Это, кстати, очень напоминает пример выше, с детским матом в цикле и выходом из него через случайный / параметрический выбор альтернативного хода.
Цитата: Foxhound от 18.03.2019 00:41:12P.S. предполагаю, что человек способен стимулировать выработку сератонина путем самрвнушения или даже самообмана, что есть двигать границы целей по умолчанию через обратную связь. Возможно именно эта особенность (возможность двигать цели через обратную связь) и отличает человека от остальных придставителей биосферы.
...
Цитата: Foxhound от 18.03.2019 00:41:12Это просто формулировка того же самого на языке химии. Ключевое то, что на архитектурном уровне эти цели прописаны. Рациональное мышление это выход за установленные по умолчанию цели и формулировка новых. Это, кстати, очень напоминает пример выше, с детским матом в цикле и выходом из него через случайный / параметрический выбор альтернативного хода.
Переход к химии вместо продолжения обсуждения логики эквивалентно обсуждению архитектуры процессора при обсуждении базовой логики работы программы или алгоритма (когда речь идет не о производительности). Однако при обсуждении схемы работы алгоритмов никого не интересует как это реализуется на аппаратном уровне, за исключением ограниченного числа специальных случаев, тоже самое можно сказать и о человеческом интеллекте - на какой аппаратной базе он реализован важно только в контексте его быстродействия и оптимизации. Сама логика его работы должна быть инвариантна по отношению к тому, какое "железо" используется (химический компьютер или электронное устройство).
P.S. предполагаю, что человек способен стимулировать выработку сератонина путем самрвнушения или даже самообмана, что есть двигать границы целей по умолчанию через обратную связь. Возможно именно эта особенность (возможность двигать цели через обратную связь) и отличает человека от остальных придставителей биосферы.
...
Цитата: rommel.lst от 18.03.2019 16:23:51На "архитектурном" уровне "целей" (а точнее факторов удовлетворения) столько прописано, что выбрать главную из них нереально. Ситуационно + в следствие накопления жизненного опыта человек постепенно выделяет приоритеты. Причем, делает он это решая не формализованные задачи. Т.е. идя по ситуациям, где не ясно, что же является положительным исходом. Зачастую ведь бывает так, что используется принцип "все, что ни делается - все к лучшему". Т.е. тут вроде бы работает принцип нейронной сети, но тренировать ее можно зачастую исходя из противоположных критериев, но получая один результат..
Цитата: rommel.lst от 18.03.2019 16:23:51Можно, конечно, убедить себя, что все зачепись! И жить согласно этому критерию. Но является ли это признаком интеллекта? ХЗ. Особенно, если по прошествии времени вдруг оказалось, что выбор того, что есть "правильно" был объективно ошибочным.
Цитата: Foxhound от 18.03.2019 22:46:43Неудивительно, учитывая что нейронные сети "срисовали" с мозга.
Цитата: Foxhound от 18.03.2019 22:46:43Тут ключевое не то, что это хорошо или плохо (правильно / не правильно), а то, что эти вещи могут переформулироваться и меняться по моему. Дальше уже работает обратная связь.
Цитата: rommel.lst от 19.03.2019 05:45:49Кто вам это сказал?
ЦитатаПерцептро́н, или персептрон[nb 1] (англ. perceptron от лат. perceptio — восприятие; нем. Perzeptron) — математическая или компьютерная модель восприятияинформации мозгом (кибернетическая модель мозга), предложенная Фрэнком Розенблаттом в 1957 году и впервые реализованная в виде электронной машины «Марк-1»[nb 2] в 1960 году. Перцептрон стал одной из первых моделей нейросетей, а «Марк-1» — первым в мире нейрокомпьютером.
ЦитатаОтчёт по первым результатам появился ещё в 1958 году — тогда Розенблаттом была опубликована статья «Перцептрон: Вероятностная модель хранения и организации информации в головном мозге»[7]. Но подробнее свои теории и предположения относительно процессов восприятия и перцептронов он описывает 1962 году в книге «Принципы нейродинамики: Перцептроны и теория механизмов мозга». В книге он рассматривает не только уже готовые модели перцептрона с одним скрытым слоем, но и многослойных перцептронов с перекрёстными (третья глава) и обратными(четвёртая глава) связями. В книге также вводится ряд важных идей и теорем, например, доказывается теорема сходимости перцептрона[8].
Цитата: Поверонов от 19.03.2019 09:17:23Перцептрон
Цитата: rommel.lst от 19.03.2019 10:23:47Потенциала саморазвития нет в принципе. А это, ИМХО, краеугольный камень любого полноценного интеллекта.
Цитата: Slav Rus от 18.03.2019 10:29:33Зачем "городить огород"
Этого вполне достаточно, "три закона робототехники", сформулированных Айзеком Азимовым ещё в 1942 году:
- Робот не может причинить вред человеку или своим бездействием допустить, чтобы человеку был причинён вред.
- Робот должен повиноваться всем приказам, которые даёт человек, кроме тех случаев, когда эти приказы противоречат Первому Закону.
- Робот должен заботиться о своей безопасности в той мере, в которой это не противоречит Первому или Второму Законам.
Цитата: rommel.lst от 19.03.2019 05:45:49Кто вам это сказал?
НС - это просто сумматор, который определяет интегральное влияние входных факторов на конечный результат. В более примитивном виде использовался уже давно. Аналогии с мозгом придумали уже потом - мол, сумма сигналов от кучи нейронов дает нам возможность оценить результат..
Я, например, думаю, что это слишком простая интерпретация, слабо применимая к высшей нервной деятельности.