IT в России и мире в реалиях мирового кризиса
1,439,524 8,535
 

  DeC ( Слушатель )
30 янв 2025 в 23:17

Россияне и китайцы простым алгоритмом ускорили видеокарты Nvidia в 800 раз. Это удар по санкциям США - South China Morning Post

новая дискуссия Статья  1.939

18:15 - 30/Янв/25

КНР и Россия разработали метод повышения производительности видеокарт Nvidia в научных вычислениях. Их удалось ускорить в 800 раз. Nvidia по решению властей США сильно ограничена в поставках своих решений для науки на Восток.

Санкции нипочем
Ученые из России и Китая совместными усилиями научились повышать производительность видеокарт Nvidia в научных вычислениях, пишет South China Morning Post. Они использовали для этого информацию, почерпнутую в ходе реверс-инжиниринга – обратного проектирования ускорителей.

Полученные знания позволили авторам идеи ускорить карты Nvidia в научных вычислениях в 800 раз. Алгоритм для работы с памятью карты, позволяющий сделать это, создали ученые из университета МГУ-ППИ.

Университет МГУ-ППИ в расположен Шэньчжэне (Китай) и является первым совместным российско-китайским вузом. Он учрежден в 2014 г., а его соучредителями являются российский МГУ имени М.В. Ломоносова, Пекинский политехнический институт наряду с Муниципальным народным правительством Шэньчжэня.



Недорогая видеокарта из ближайшего компьютерного магазина теперь может стать «сердцем» высокопроизводительных вычислений

Новый алгоритм решает общую для России и КНР проблему – обе страны находятся под санкциями США и испытывают трудности с поставками ускорителей Nvidia для высокопроизводительных вычислений, в том числе для искусственного интеллекта. На обычные карты это тоже распространяется, но в меньшей степени, и китайцы, как сообщал CNews, уже научились превращать их в полноценные ускорители искусственного интеллекта. Также они скупают игровые ПК и затем вытаскивают из них видеокарты Nvidia и продают их отдельно, тем самым обходя санкционные ограничения.

Новый алгоритм, по сути, позволяет не обращать внимание на санкции и использовать в научных расчетах игровые видеокарты Nvidia, которые можно купить в официальной российской рознице, пусть и по завышенной (в связи с курсом рубля и параллельным импортом) цене.

В чем преимущество
Как пишет South China Moring Post, совместная китайско-российская разработка открывает новые возможности для решения различных сложных механических задач во многих отраслях промышленности. Издание приводит в качестве примера в первую очередь аэрокосмическую и военную промышленности

Также South China Moring Post сделало акцент на том, что новый алгоритм позволяет проводить вычисления на видеоускорителях, которые отличаются низкой стоимостью (видимо, в сравнении с ускорителями для искусственного интеллекта) и не подпадают под санкции США.

Скрывать нечего
Засекречивать факт проделанной работы китайские и российские специалисты не стали. Они описали основные ее моменты в статье, опубликованной в китайском журнале Journal of Computational Mechanics.

Технически, авторы алгоритма провели реверс-инжиниринг архитектуры Nvidia с поддержкой среды CUDA. По их словам, они достигли впечатляющих результатов. 

«Эта эффективная вычислительная мощность позволяет исследователям сократить затраты времени на вычисления, которые обычно занимают несколько дней, до нескольких часов или даже минут при использовании обычного домашнего графического процессора, что является значительным достижением для исследований в области частичных децентрализованных процессов», – говорится в статье ученых.

Практическое применение
Разработанный специалистами МГУ-ППИ алгоритм лег в основу созданной ими же среды разработки PD-General. Этот фреймворк предлагается использовать для проведения расчетов в сфере перидинамики. Это нелокальный численный метод для оценки материалов на их неоднородную деформацию, включая трещины и полное разрушение.

Перидинамика часто применяется в аэрокосмической отрасли. При помощи нового алгоритма такие вычисления теперь можно ускорить в 800 раз.

Источник

ПодмигивающийНепонимающий
Отредактировано: ConstB - 31 янв 2025 в 17:17
  • +3.76 / 86
  • АУ
ОТВЕТЫ (39)
 
 
  Nansen ( Слушатель )
31 янв 2025 в 07:36

Россияне и китаяне? Российцы и китайцы?
Русские и китайцы!
  • +0.24 / 15
  • АУ
 
 
  olenevod ( Практикант )
31 янв 2025 в 08:02

Тогда уж русские и ханьцы. Потому как какой-нибудь уйгур китаец, но не ханец.
  • -0.16 / 9
  • АУ
 
 
 
  Nansen ( Слушатель )
31 янв 2025 в 08:05

Уйгуры с китайской стороны и башкиры с русской точно не участвовали? Веселый
  • -0.12 / 5
  • АУ
 
 
 
 
  Ajarius ( Практикант )
31 янв 2025 в 09:25

В Вашей формулировке «русские и китайцы» — точно нет.
  • +0.16 / 5
  • АУ
 
  Aliot ( Слушатель )
31 янв 2025 в 07:55

Нихрена не понял.
Они что,наконец- то доперли, что на видюхе можно проводить достаточно
сложные вычисления, а не только создавать биткойны?
Или перешли с вертексных шейдеров на пиксельные?
Если так, то как раз скорость в 800 раз и получается😀😀😀
  • +0.22 / 13
  • АУ
 
 
  dmitriк62 ( Слушатель )
31 янв 2025 в 10:54

    
Как я понял, некий физический метод был реализован их рук вон плохо, а наши его переписали по-человечески, с учётом архитектуры.
Вот и всё.
   
Остальное — бред междуогородного жирнаглиста.
  • +0.38 / 15
  • АУ
 
 
 
  ivan2 ( Слушатель )
31 янв 2025 в 12:23

Трамп вторгся в политику.
Программисты вторглись в "политику".
Теперь с видюхами стали общаться не на языке: "Нарисуй линию", а на низком уровне регистров.
  • +0.04 / 6
  • АУ
 
 
 
  GrinF ( Слушатель )
01 фев 2025 в 23:07

других путей я и не вижу
Цитата
Остальное — бред междуогородного жирнаглиста.
  • +0.00 / 0
  • АУ
 
 
  zap ( Слушатель )
31 янв 2025 в 14:30

Ибо нет ни эллинавертекса, ни иудеяфрагмента, но всё есть вычислительный шейдер.
Там что-то есть про реверс-енжиниринг CUDA.
Возможно, разобрались с низкоуровневыми командами графических процессоров, которые у нвидия закрыты.
И теперь типа могут программы сразу на "ассемблере" писать, мимо CUDA.
  • +0.02 / 8
  • АУ
 
 
 
  dmitriк62 ( Практикант )
31 янв 2025 в 15:08

   
Вы про КУДУ краем уха слышали или совсем ничего?
Смеющийся
  • -0.11 / 2
  • АУ
 
 
 
  Alexander_53 ( Слушатель )
31 янв 2025 в 17:46

У нас это называлось "в машинных (процессорных) кодах". Это еще до ассемблера... Приходилось. Тяжелое детство...:-)
  • +0.36 / 12
  • АУ
 
 
 
 
  gmk ( Слушатель )
31 янв 2025 в 17:56

Ассемблер по сути и есть машинная мова, только на человечьем языке. Писание на ассемблере занятие нудное и сложное, требующее знания архитектуры машины досконально. Но код получается зело быстр и компактен, ежели в ем ашипок нет. Если ИИ научится писать на ассемблере, я бы очень крепко задумался - куда тикать.
Кстати, всегда считал что ИИ зарядят на оптимизацию кода на низкоуровневые языки - это с чего надо было начинать внедрение.
И тикать.
  • +0.36 / 18
  • АУ
 
 
 
 
 
  Alexander_53 ( Слушатель )
31 янв 2025 в 18:52

Никто не спорит. Мне TASM долго нравился... Только машинные коды сразу в ПЗУ прошить можно, как набил. А так.. модуль распознавания объекта из видеосигнала.. вот тебе 16 килобайт в ПЗУ, и не в чем себе не отказывай.Улыбающийся
  • -0.09 / 3
  • АУ
 
 
 
 
 
  dmitriк62 ( Слушатель )
31 янв 2025 в 19:36

     
Если речь идёт об уровне "алгоритм рисования окружности", то вопросов нет. 
Впрочем, этому можно и обезьяну научить.

В реальности же есть две проблемы:
    
1. Настоящая задача на 99% это составление описания задачи, а собственно кодирование ни о чём (если исключить перекодирование при изменении описания при обнаружении ошибок в нём).
   
2. Оптимизация кода (хоть на ассемблере, хоть на любом приличном языке уровнем повыше) - требует массовых прогонов на реальном оборудовании и понимания происходящего.
    
И то, и другое не имеет ничего общего с кривой выборкой из ранее сделанного кем-то, которую жирнаглисты зачем-то называют "искусственным интеллектом".
В очках
  • +0.03 / 3
  • АУ
 
 
 
 
 
 
  Alexander_53 ( Слушатель )
31 янв 2025 в 20:02

Согласен абсолютно. В ИИ нет и пока не видно зачатков интеллекта. Это просто большая помойка бигдаты.

И серьезно.
И не важно, как писали код. Изделие летит, попадает...  Значит работали не зряУлыбающийся
  • -0.03 / 1
  • АУ
 
 
 
 
 
  GrinF ( Слушатель )
01 фев 2025 в 23:12

Ну пробуйте на ассемблере написать сепоирование пространства белковой глобулы... я посмотрю на этого героя... За последних 3 дня переобщался  с deepseek... первоначальный восторг сменгился на глубокий скепсис - врет безбожно, провеоять нужно все... и нахер это поделие нудн... могу вылодить диалоги
  • +0.00 / 0
  • АУ
 
 
 
 
  tigra ( Слушатель )
31 янв 2025 в 18:05

На современных видеокартах Nvidia всем управляет встроенная подписанная компанией Nvidia прошивка, результаты у оной и той же карты с разными прошивками тоже может отличаться кардинально, не приведены ни типы карт, ни версии прошивок. Без подобной прошивки работали карты позапрошлого поколения. Кроме того, в первоначальной статье сравнивают почему-то с CUDA, хотя для более современных карт NVIDIA есть и более быстрые и более современные технологии, поэтому я и написал, что опубликованных данных не достаточно для технического анализа реальности ускорения в 800%. Не описаны области применения, алгоритмы, используемая архитектура или поколение карт и пр. Слишком похоже на желтушный кликбейт. Может быть, ускорили на 800% по сравнению с вычислениями на центральном процессоре, но, опять таки, ни базовый, ни улучшенный вариант не описаны, что с чем сравнивалось, как, в каких условиях, можно ли это воспроизвести. А без повторяемости и воспроизводимости результат не научен, относится к вере.
  • +0.24 / 8
  • АУ
 
 
 
 
 
  Alex Gay ( Слушатель )
31 янв 2025 в 19:34

Согласен, без конкретики - голая реклама. Но в первоначальном сообщении мелькнуло понятие "обратный инжиниринг". Вот тогда я верю, что за счет замены микрокоманд можно в разы ускорить вычисления
  • -0.05 / 3
  • АУ
 
 
 
 
 
 
  bar_bos ( Слушатель )
31 янв 2025 в 19:57

Конкретика, которая внезапно могла бы помочь "обратному инжинирингу" - это небезызвестный позапрошлогодний взлом Нвидии и утечка мноооогих занятных данных, включая исходники фирмварей, драйверов и код на verilog/VHDL .
Даже я стянул из любопытства тот архивчик, размером, если не ошибаюсь, больше 100 гиг,  на посмотреть.
  • +0.00 / 0
  • АУ
 
 
 
 
 
  dmitriк62 ( Слушатель )
31 янв 2025 в 19:41

   
Простите, Вы когда-нибудь имели дело с этими картами?
Или только играли на них в игрушку?!
Зачем пишете такой бредовый бред?!?!
Рыгающий
  • +0.02 / 3
  • АУ
 
 
 
 
  Alex Gay ( Слушатель )
31 янв 2025 в 19:08

Вспомнился БЗ-34. Школа получила 2-е штуки, а что с ними делать, никто не знал... Выпросил один у физика (а тогда в ТМ печатали программы), на нем и учился программировать. До сих пор привычка осталась - экономить память.
  • +0.04 / 7
  • АУ
 
 
 
 
 
  olenevod ( Слушатель )
31 янв 2025 в 19:25

О! Знатная вещь. Я на нём уже на работе программироал, пока на Фортран не перешёл:-)
  • +0.21 / 3
  • АУ
 
 
 
 
 
  Alexander_53 ( Слушатель )
31 янв 2025 в 19:34

Посадка на Луну?Улыбающийся
  • +0.04 / 2
  • АУ
 
 
 
 
 
 
  Alex Gay ( Слушатель )
31 янв 2025 в 19:44

Не прошел только последнюю миссию - посадку на Землю...Грустный
  • +0.06 / 2
  • АУ
 
 
 
 
 
 
 
  slavae ( Слушатель )
02 фев 2025 в 04:46

А что, и такая была? Наверно это я уже из школы ушел, там не до того было.
  • +0.00 / 0
  • АУ
 
 
 
 
 
 
  releyman ( Слушатель )
31 янв 2025 в 19:59

Да! Затем посложнее: вывод корабля на окололунную орбиту. Это я еще пробовал. А потом еще полет на Землю. 
Были времена...
  • +0.00 / 0
  • АУ
 
 
  NikitA ( Слушатель )
31 янв 2025 в 15:23


Марк Шнейдер был маркшейдер...

по-русски, пожалуйста
  • +0.26 / 5
  • АУ
 
 
 
  tigra ( Слушатель )
31 янв 2025 в 17:33

Кто-то безбожно врет или чего-то не договаривает. Такое ускорение возможно при использовании специализированных алгоритмов, в частных случаях, на старых картах, которые не контролируются встроенным firmware и/или, например, с понижением точности с 32-бит на 16, 8 или 4. Заявление чисто политическое или кликбейтное, для технической оценки не хватает данных.
  • +0.05 / 10
  • АУ
 
 
 
 
  OlegNZH-2 ( Слушатель )
31 янв 2025 в 18:13

Блинн . Оффтоп ... Никто скорее всего не врёт - а просто нашли задачу (для себя), где математические вычисления можно "распараллелить " по всем 800(условно , у дешёвой) ядрам графической карты   ...  Вот и похвалились  , что нашли как это сделать... Хотя этому - "уже сто лет в обед "  , и для научных вычислений используется , где математика требуется .  (проблема именно в задаче , и как её загрузить на ядра.... т.е велосипед , Свой изобрели  , которым уже давно все пользуются).
  • +0.14 / 3
  • АУ
 
 
 
 
 
  tigra ( Слушатель )
31 янв 2025 в 18:23

Ну да, для тонкостенных оболочек по МКУ (методу конечных элементов) можно не весь объем,т.е. всю матрицу рассчитывать, а свести к линейной зависимости от радиуса (внутреннего и внешнего), и вместо условного для 90х или 2000х годов стремящегося к бесконечности компьютера Сray Rеsearch провести расчет на 386 или 486 компьютере. Если не врут, значит, умалчивают или недоговаривают, это и задело. Не понимающие люди восторгаются.
Молодцы, что ускорили. Плохо, что не указывают, в каких случаях и при каких условиях.
  • +0.09 / 5
  • АУ
 
 
 
 
 
 
  Mixandr68 ( Слушатель )
31 янв 2025 в 18:28

Ускорили... Теория больших чисел. Взлом кюдо ускорил, очень ускорил. В 1000×1000 раз.
  • -0.10 / 1
  • АУ
 
 
 
 
 
 
 
  tigra ( Слушатель )
31 янв 2025 в 18:40

hic rhodus hic salta. Что по сравнению с чем ускорили и при каких условиях, для каких карт, прошивок, драйверов и пр. Ничего не указано. Сплошной сферический конь в вакууме.
  • +0.01 / 1
  • АУ
 
 
 
 
 
 
  zap ( Слушатель )
31 янв 2025 в 19:23

Ссылка на китайский Journal of Computational Mechanics. Жаль, что мы не знаем китайский Веселый
  • +0.00 / 0
  • АУ
 
 
 
 
 
 
  lwn ( Слушатель )
31 янв 2025 в 19:59

Не на то смотрите. В наше время ускорить в 800 раз что угодно - не так то просто. И если это удалось, то результат в любом случае заденет многих.
  • +0.00 / 0
  • АУ
 
 
 
 
  dmitriк62 ( Слушатель )
31 янв 2025 в 19:26

    
Алгоритм нелокальный, всё упирается в доступ к памяти, а она там устроена хитрее, чем даже у кружковцев из Интеля.
   
Так что если исходная реализация написана без понятия, то ускорение в 800 раз более чем возможно (из личного опыта).

--- оффтоп ---
  • +0.04 / 2
  • АУ
 
 
 
 
 
  GrinF ( Слушатель )
01 фев 2025 в 23:15

ав тепла тоже в 800 раз выделяться будет - как отводить то будете ... если изначальную реализацию писал быдлоколер у которого куча локов в коде, то всяк кто очистил эти локи конечно будет героем
  • +0.00 / 0
  • АУ
 
  Ивиан Корн ( Слушатель )
31 янв 2025 в 16:55

Выделенной, это , по моему мнению главной.
И не потому, что не под санкциями, а потому, что если это пиарить, кто то введет новые запреты на экспорт, а это уменьшение продаж у Nvidia.
Что может привести к убытками и утоплению "конкурента"
  • +0.47 / 6
  • АУ
 
  Galaxycon ( Слушатель )
31 янв 2025 в 23:04

Ну поживем, увидим. А то недавно статью про новые аккумуляторы для мобильников писали, которые лет тридцать будут работать без подзарядки.Улыбающийся Может того же поля ягоды?
  • +0.00 / 0
  • АУ
 
  GrinF ( Слушатель )
01 фев 2025 в 23:05

Свежо питание да серецо с трудом....
  • +0.00 / 0
  • АУ