Искусственный интеллект, нейросети

109,226 826
 

Сообщения

Поверонов
 
Слушатель
Карма: +36.13
Регистрация: 05.06.2010
Сообщений: 18,108
Читатели: 7
Цитата: folk от 23.09.2023 11:06:50Вопрос. Я так понимаю что перевод при помощи ИИ основан на скармливании ему при обучении большого корпуса переводов.
Подозреваю что для большого эффекта использовались и тексты из интернетов.  Не обсуждаю как оно там было по качеству.
Но вот в чем вопрос. Для усовершенствований надо снова проводить обучение по всему корпусу - вроде как инкрементального обучения не существует. Но часть из "интернетов" уже содержит огромный процент переводов ИИ.
В нормальном подходе такие переводы не должны быть использованы при обучении. Но вот как их отбраковать - не понятно.
Если кто в теме - прокомментируйте пожалуйста.

существуют огромные оцифрованные объемы профессионально переведенной литературы - они и скармливались
  • +0.04 / 3
  • Скрыто
Поверонов
 
Слушатель
Карма: +36.13
Регистрация: 05.06.2010
Сообщений: 18,108
Читатели: 7
Цитата: gbooth от 23.09.2023 14:33:59Так вот в чем причина плохой работы моделей перевода!

так не только перевод - там все модели посредственные, но как их сделать лучше никто не знает.
LLM генерируют наиболее вероятное продолжение то есть самое банальное. А от банальщины не стоит ожидать откровений
  • +0.02 / 2
  • Скрыто
psv
 
Слушатель
Карма: +1.28
Регистрация: 27.03.2009
Сообщений: 1,697
Читатели: 0
Цитата: gbooth от 23.09.2023 15:51:24У вас в тексте и содержится ответ.  Модель посредственная потому что она по своей конструкции сходится в середину, к интерсубъективному мнению, которое общепринято и банально. Применения как раз и подразумевают интерсубъективную банальность.  Там сейчас вопрос о новых фактах, о событиях после начала обучения.  Надо привязать семантическую БД и граф знаний к движку. 
.
Откровений от медианы ждать не стоит. Откровение это всегда выброс, аномальность.  Но модель усреднения обычно хорошо подходит для выявления аномальных отклонений, выбросов, всего за пределами трёх сигм.  Надо как то увязывать ТРИЗ и бредогенератор. ))

Глупости, любая генеративная модель считаем максимум качества для предложения (а то и большего куска) в целом. По пути естественно перебирает все варианты каждого слова.
  • +0.00 / 0
psv
 
Слушатель
Карма: +1.28
Регистрация: 27.03.2009
Сообщений: 1,697
Читатели: 0
Цитата: gbooth от 23.09.2023 21:29:55Ну так максимум качества и есть соответствие медианному смыслу.  Но галлюцинации все равно прорываются.  
.
Но есть желание перейти от общих мест к маргинальным аномалиям.

Нет. Любая часть "в целом" оптимальной цепочки может быть сколь угодно (ну конечно в пределах выбранных ибо растет глубина перебора) не оптимальна.
  • +0.00 / 0
small__virus
 
russia
Сочи
Слушатель
Карма: +22.09
Регистрация: 04.04.2013
Сообщений: 1,833
Читатели: 1
****
Дискуссия   529 1
Нейросеть превратит целый час аудио в текст за 30 секунд. Nova 2 молниеносно расшифрует любую речь — в 40 раз быстрее альтернатив и на 30% меньше ошибок.
Сервис транскрибирует звонки, подкасты, онлайн-встречи, видео и так далее. После регистрации обещают 45 тысяч минут аудио бесплатно — этого хватит на 750 часов.
Пробуем тут. 
https://deepgram.com/
___
Не пробовал.
_______________________________________________

Улучшить качество фоток в один клик. Если у вашего снимка плохое или нечеткое разрешение — его можно апскейлить в четыре раза.
Поддерживается JPG и PNG, можно закинуть сразу несколько файлов одновременно, а всё работает бесплатно.
Сохраняйте полезнейший сервис здесь.
https://imgupscaler.com/
Дискогрыз полиморфный обыкновенный, редчайшей породы гад, падла зеленая...
  • +0.03 / 4
бардак с идеями
 
russia
Красноярск
51 год
Слушатель
Карма: +10.84
Регистрация: 08.08.2012
Сообщений: 4,514
Читатели: 1
Цитата: small__virus от 03.10.2023 09:23:53_______________________________________________

Улучшить качество фоток в один клик. Если у вашего снимка плохое или нечеткое разрешение — его можно апскейлить в четыре раза.
Поддерживается JPG и PNG, можно закинуть сразу несколько файлов одновременно, а всё работает бесплатно.
Сохраняйте полезнейший сервис здесь.
https://imgupscaler.com/

Ни разу не не пользовался а уже лимит бесплатный превышен. )))
  • +0.00 / 0
Сейчас на ветке: 2, Модераторов: 0, Пользователей: 0, Гостей: 1, Ботов: 1