IT в России и мире в реалиях мирового кризиса
1,401,115 8,469
 

  Senya ( Слушатель )
23 апр 2016 09:47:48

Тред №1087244

новая дискуссия Дискуссия  232

Цитата: l-mik от 22.04.2016 23:13:15Полтора такта у пентиума - это, наверное, после компилятора. Если же вручную на ассемблере писать, то две команды на такт всегда получить можно было. Я в студенческие времена графическими софтовыми растеризаторами аля Quake занимался. На пентиуме, в отличие от следующих поколений, все задержки были легко предсказуемы.
Т.е. При ручной оптимизации раз в 5 действительно быстрее было.


У него два АЛУ. Если поток команд состоит из множества однотипных команд обработки данных (что характерно для графических задач), он легко и благодарно параллелизуется. Что мы и видим в графических процессорах, в которых счет узлам параллельной обработки пошел на десятки и сотни, и все они могут быть нормально загружены. А всякие неприятные вещи, типа сортировки массива, хорошо если те же пресловутые полтора такта на команду выдадут, и то пока массив не перестанет в кэш влазить.

Насчет предсказуемости Пентиума, если честно, не знаю. Получилось так, что я с 286 сразу перепрыгнул на четверку, минуя трешку. Увидел, что мои ассемблерные извраты, обеспечивающие двукратный рост производительности, дают теперь от силы 5%, причем ещё неизвестно, в какую сторону, и забил на дальнейшее углубление в тонкости архитектуры. Так, почитывал из любопытства, но не использовал.
  • +0.03 / 3
  • АУ
ОТВЕТЫ (3)
 
 
  LightElf ( Слушатель )
24 апр 2016 01:18:01

А еще пенек гораздо круче в плавучке. В разы, если не на порядок. 
  • +0.00 / 0
  • АУ
 
 
  Senya ( Слушатель )
24 апр 2016 09:42:27

На такт частоты? Вот сам не мерял, а по чужим данным спорить влом.Улыбающийся Но с чего бы такой рывок?
  • +0.01 / 1
  • АУ
 
 
 
  LightElf ( Слушатель )
24 апр 2016 19:10:10

Окончательно подавлено тяжкое наследие внешнего сопроцессора. FPU переделали с нуля, он стал полноценной частью процессора. Раздельные кэши данных и инструкций, 64-битая внешняя шина с вдвое большей тактовой частотой. В общем даже с старыми компиляторами 2-3х в плавучке было налицо. А ручным кодингом на даблах и больше выжимали. 
  • +0.03 / 2
  • АУ