Искусственный интеллект, нейросети
176,790 1,030
 

  folk ( Слушатель )
23 сен 2023 11:06:50

перевод ИИ

новая дискуссия Дискуссия  295

Вопрос. Я так понимаю что перевод при помощи ИИ основан на скармливании ему при обучении большого корпуса переводов.
Подозреваю что для большого эффекта использовались и тексты из интернетов.  Не обсуждаю как оно там было по качеству.
Но вот в чем вопрос. Для усовершенствований надо снова проводить обучение по всему корпусу - вроде как инкрементального обучения не существует. Но часть из "интернетов" уже содержит огромный процент переводов ИИ.
В нормальном подходе такие переводы не должны быть использованы при обучении. Но вот как их отбраковать - не понятно.
Если кто в теме - прокомментируйте пожалуйста.
Отредактировано: folk - 23 сен 2023 11:07:36
  • +0.00 / 0
  • АУ
ОТВЕТЫ (8)
 
 
  gb ( Слушатель )
23 сен 2023 12:42:35
Сообщение удалено
gbooth
25 сен 2023 19:13:40
Отредактировано: gbooth - 25 сен 2023 19:13:40

  • +0.06
 
  Поверонов ( Слушатель )
23 сен 2023 13:56:03

существуют огромные оцифрованные объемы профессионально переведенной литературы - они и скармливались
  • +0.04 / 3
  • АУ
 
 
  gb ( Слушатель )
23 сен 2023 14:33:59
Сообщение удалено
gbooth
25 сен 2023 19:13:38
Отредактировано: gbooth - 25 сен 2023 19:13:38

  • +0.00
 
 
 
  Поверонов ( Слушатель )
23 сен 2023 15:33:55

так не только перевод - там все модели посредственные, но как их сделать лучше никто не знает.
LLM генерируют наиболее вероятное продолжение то есть самое банальное. А от банальщины не стоит ожидать откровений
  • +0.02 / 2
  • АУ
 
 
 
 
  gb ( Слушатель )
23 сен 2023 15:51:24
Сообщение удалено
gbooth
25 сен 2023 19:13:35
Отредактировано: gbooth - 25 сен 2023 19:13:35

  • +0.01
 
 
 
 
 
  psv ( Слушатель )
23 сен 2023 21:06:08

Глупости, любая генеративная модель считаем максимум качества для предложения (а то и большего куска) в целом. По пути естественно перебирает все варианты каждого слова.
  • +0.00 / 0
  • АУ
 
 
 
 
 
 
  gb ( Слушатель )
23 сен 2023 21:29:55
Сообщение удалено
gbooth
25 сен 2023 19:13:34
Отредактировано: gbooth - 25 сен 2023 19:13:34

  • +0.00
 
 
 
 
 
 
 
  psv ( Слушатель )
23 сен 2023 21:51:05

Нет. Любая часть "в целом" оптимальной цепочки может быть сколь угодно (ну конечно в пределах выбранных ибо растет глубина перебора) не оптимальна.
  • +0.00 / 0
  • АУ