Цитата: l-mik от 22.04.2016 23:13:15Полтора такта у пентиума - это, наверное, после компилятора. Если же вручную на ассемблере писать, то две команды на такт всегда получить можно было. Я в студенческие времена графическими софтовыми растеризаторами аля Quake занимался. На пентиуме, в отличие от следующих поколений, все задержки были легко предсказуемы.
Т.е. При ручной оптимизации раз в 5 действительно быстрее было.
У него два АЛУ. Если поток команд состоит из множества однотипных команд обработки данных (что характерно для графических задач), он легко и благодарно параллелизуется. Что мы и видим в графических процессорах, в которых счет узлам параллельной обработки пошел на десятки и сотни, и все они могут быть нормально загружены. А всякие неприятные вещи, типа сортировки массива, хорошо если те же пресловутые полтора такта на команду выдадут, и то пока массив не перестанет в кэш влазить.
Насчет предсказуемости Пентиума, если честно, не знаю. Получилось так, что я с 286 сразу перепрыгнул на четверку, минуя трешку. Увидел, что мои ассемблерные извраты, обеспечивающие двукратный рост производительности, дают теперь от силы 5%, причем ещё неизвестно, в какую сторону, и забил на дальнейшее углубление в тонкости архитектуры. Так, почитывал из любопытства, но не использовал.