Опубликовано более 350 Гб русских текстов для работы с задачами обработки естественного языка.
Руководитель направления NLP в Sberbank Data Science Communtiy Татьяна Шаврина у себя в Facebook сообщила о публикации библиотеки Corus, где собрано более 350 Гб русских текстов, отсортированных под разные задачи в области обработки естественного языка.