Цитата: Zkvxz от 10.09.2024 07:23:25Эта проблема не ограничивается только текстом. Другая группа исследователей из Университета Райса изучала, что произойдет, если типы ИИ, которые генерируют изображения, будут многократно обучаться на собственных выходных данных — проблема, которая может уже возникать, поскольку изображения, генерируемые ИИ, наводняют сеть.
И что тут не понятного?.
Давайте немножко на пальцах, как это все работает. Очень упрощенно и утрированно.
Сначала нейросеть обучают распознавать изображения. Вот это стул, это стол. Причем, никаких правил, типа "рука растет из плеча, а не из жопы" или "пальцев пять" нет. Это потом как то довкладывать научились.
Так же учат стилям - скармливают кучу картинок, вкладывая в модель, что в этом стиле стул и стол выглядят так, а в том - вот так.
Следующий шаг, нет, не генерация. Следующий шаг восстановление изображений. Берется поврежденное, и на основе пытается вытянутся оттуда информация. Естественно, с корректировкой обучения.
И вот только следующий шаг - берется чистый шум, и из него нейросеть заставляют "вытягивать" нужные изображения. Напрямую она ничего не генерирует. Хотя некоторые связанные объекты "додумать" может. Например, в лесу - ручей и цветы, случайную птичку или зверя. Выбрать цвет одежды на персонаже или вообще какая она.Т.е. из "облака связанных вещей", которые могу попадаться на изначальных картинах. И т.д., причем они, так же, определяются чистейшим рандомом и тем, чему обучали.
По большому счету, что будет сгенерировано, можно сказать, определяется первоначальным шумом и алгоритмами (и данными обучения) для "восстановления".
Теперь нужно вспомнить, что такое нейросеть "в большом смысле".
Утрированно, это граф, зависящий от входящих параметров.
А теперь возвращаемся в институт.
Есть черный ящик. Который что-то там делает (не важно что, вон, выше описано). Его входные данные - это шум и полезные данные. Что-то мы на выходе имеем. Утрированно - смесь данных и шума, но в том виде, которые нас устраивают. Пока устраивают.
Но. Теперь представьте, черный ящик, в который вместо данных с каждым шагом начинают подаваться данные с шумом. Этого шума в выходных данных с каждым шагом будет все больше и больше, пока... правильно, мы не приходим к ситуации, что на входы черного ящика идет шум. Естественно, что на выходе будет тоже шум. Каким-то образом упорядоченный и структурированный, но все равно, шум.
______
Это если так, упрощенно и крайне утрированно, просто для понимания.