Кристалл процессора 9Mb96GВ конце декабря 2017 года с фабрики
TSMC (Тайвань) были получены образцы микропроцессора MALT-C 9Mb96G - первого чипа семейства
MALT-C, изготовленного «в кремнии» по технологическому процессу 28 нм. TSMC HPCPlus (high-performance computing, высокопроизводительные вычисления). Процессор содержит 9 RISC ядер общего назначения и 96 специализированных процессорных элементов, объединенных в три SIMD кластера по 32 элемента каждый. Образцы микропроцессора MALT-C 9Mb96G успешно прошли входные испытания на тестовых векторах на
чип-тестере FORMULA, показали на полной нагрузке соответствие проектируемых и достигнутых характеристик.
Так полное энергопотребление на рабочей частоте 800 МГц составило 1,0 Вт. MALT-C – семейство микропроцессоров российской разработки для выполнения вычислительно сложных криптопреобразований с предельной энергоэффективностью. Чип построен на базе
отечественной многоядерной архитектуры. Благодаря чрезвычайно удачному компилятору С, программировать MALT-C 9Mb96G не многим сложнее, чем универсальные многоядерные процессоры.
Кто мы? Мы - российская команда разработчиков многоядерных процессоров. Мы начали проект в 2011 году. Тогда мы утверждали, что через 5-10 лет в процессоре будут сотни вычислительных ядер, энергоэффективность будет важнее производительности, производительность будет достигаться за счет специализации вычислительных блоков и параллельной обработки, а микроархитектура будет определяться энергетикой и технологией. Мы поставили цель - стать к 2020 году разработчиком многоядерных процессоров мирового уровня. Мы собрали сильную команду и сегодня мы действующий fabless дизайн-центр. Наши процессоры
производятся на крупнейшей независимой фабрике TSMC по технологии 28 нм. Мы разрабатываем не только кристаллы, но и всю необходимую
программную инфраструктуру, создавая
законченные программируемые решения. Наши компетенции Мы специалисты в цифровой микроэлектронике и программировании. Мы хорошо знаем историю развития вычислительной техники и имеем практический опыт работы с целым рядом программируемых вычислительных систем от 8-ми битных микроконтроллеров, содержащих тысячу транзисторов, до современных многоядерных CPU/GPU, содержащих миллиарды транзисторов, от первой UNIX ОС до современных дистрибутивов Linux, от первого компилятора языка Fortran до применяемых сейчас языков C/C++/C#/Python/Java/PHP и так далее.
В наших разработках мы, с одной стороны, опираемся на традиции и накопленный за последние 30 лет российский и мировой микроэлектронный опыт. С другой, не скованы обязательствами архитектурной совместимости и не избегаем разработки отдельных компонентов "железа" и ПО “с нуля”, когда это позволяет им стать предельно энергоэффективными.
Сегодня наша команда состоит из выпускников ведущих научных школ РФ: МГУ имени Ломоносова, МГТУ им. Баумана, МИФИ, МФТИ. В нашем коллективе семь кандидатов и два доктора наук. В нашем коллективе работают специалисты по цифровому и аналоговому RTL-дизайну и схемотехнике, специалисты по разработке процессорных ядер и архитектур, разработчики IP-блоков интерфейсов, специалисты по симуляции и верификации RTL, специалисты по контроллерам памяти, специалисты в области системного программирования, разработчики компиляторов универсальных и проблемно-ориентированных языков, С/С++ программисты, специалисты по параллельному программированию и отладке параллельных программ, разработчики прикладного ПО и алгоритмов, специалисты в области тестирования ПО, технические писатели, юристы, менеджеры по развитию.
Научные исследования мы проводим
совместно с ведущими ВУЗами и научно-исследовательскими институтами России, наша технологическая база включает наиболее современное оборудование из Америки, Европы и Азии, мы используем ставшее стандартом в отрасли программное обеспечение
компаний - технологических лидеров из США, мы плодотворно работаем с основными производителями микроэлектроники в России, мы выполняем работы в интересах
государственных, коммерческих и индустриальных заказчиков, мы предлагаем как услуги по проектированию цифровой микроэлектроники и ПО в рамках
нашего подхода, так и
законченные решения на базе
архитектуры MALT.Архитектура Как это работает? Около 80% любого из разрабатываемых нами кристаллов, занимают однотипные вычислительные элементы, спроектированные “с нуля” специально
под целевой класс задач . Эти элементы определяют производительность и энергетику чипа. Их на кристалле от сотен до тысяч! Все вычислительные элементы программируемы на языке С или его подмножестве. Вычислительные элементы объединены в группы, управляемые компактными универсальными RISC процессорами, объединенными в вычислительный массив, “выглядящий” для программиста как обычный,
программируемый на C/C++многопотоковый процессор. Классические проблемы многопоточного программирования (
механизмы разрешение конфликтов одновременного доступа к общим данным, в том числе атомарные операции) мы решили аппаратно на уровне контроллера памяти.
Краткий взгляд на архитектуру MALT Основу архитектуры MALT составляют десятки или сотни,
в зависимости от модели , компактных асинхронных универсальных вычислительных ядер, объединенных одной или несколькими оригинальными
worm-hole сетями с топологией типа
fat-tree. Коммуникация между сетями - программно-аппаратная. Иерархия универсальных ядер включает три уровня: supermaster - управляющее ядро, master - коммуникационные ядра, slave - доступные для задач пользователя вычислительные ядра. Slave ядра,
в зависимости от модели , могут содержать векторные ускорители, выполняющие специализированные задачи целевого класса, каждый ускоритель содержит от 8-ми до 128-ми однотипных процессорных элементов с общей памятью команд. Все вычислительные ядра и ускорители имеют собственную локальную память данных. Все универсальные ядра непосредственно адресуют общую внешнюю динамическую память DRAM и другие общие ресурсы (PCIe, Ethernet, SATA). Арбитраж доступа к внешним ресурсам обеспечивается smart memory controller’ом (SMC) - аппаратным контроллером «умной памяти» с дополнительным признаком готовности данных. Количество SMC-контроллеров, перечень и конфигурация общих внешних ресурсов зависит от семейства MALT и определяется требованиями целевых задач.
Процессоры MALT - Обработка смарт-контрактов на базе Ethereum
- Создание доверенных блокчейн-решений- Потоковое шифрование, проверка целостности информации- Майнинг современных криптовалют- Работа с большими графовыми структурами
- Массивно-параллельная работа с B-деревьями- Глубокий анализ социальных сетей- Ускорение операций в SQL и NoSQL базах данных- Клеточные автоматы для задач газовой динамики
- Численные расчёты на адаптивных сетках- Метод Монте-Карло для физики элементарных частиц- Операции над нерегулярными разреженными матрицамПрименения Решение для потокового шифрования Мы предлагаем уникальное решение,
MALT-C, - программируемый на C/C++ чип с энергетикой встраиваемого микропроцессора, производительностью на Ватт на уровне современного ПЛИС на всех популярных потоковых шифрах и ценой универсального микропроцессора! Ни одного микропроцессора с подобными характеристиками ранее в России спроектировано не было!
Построенные на процессорах семейства
MALT-C криптографические ускорители предназначены для использования в задачах симметричного шифрования, в том числе для потоковых шифров. Предпочтительной является многоканальная обработка. Наши процессоры построены на доверенной отечественной архитектуре. В конце 2017 мы получили с фабрики и успешно протестировали первые образцы MALT в «кремнии».
Посмотрите на характеристики: базовый кристалл, 160-ядерный
MALT-C с индексом 7Mb160PLV, с частотой 1 ГГц и пиковым энергопотреблением 5 Вт в задаче шифрования AES128 обеспечивает максимальную пропускную способность 195 Гбит/c! (режим ECB, без учета подготовки ключа). На нем эффективно реализуется шифрование по стандартам ГОСТ 28147-89 ("Магма"), ГОСТ Р 34.11-2012 ("Стрибог") и ГОСТ Р 34.12-2015 ("Кузнечик"). Попробуйте MALT! Примените в своих разработках
MALT-C вместо зарубежных ПЛИС и криптографических сопроцессоров! Подробное сравнение приведено в таблице ниже.
Примечания:
1) Увеличение скорости работы алгоритма шифрования «КУЗНЕЧИК» с использованием технологии CUDA.2) Производительность ГОСТ-шифрования на х86- и GPU-процессорах.3) AES-GCM Encryption Performance on Intel® Xeon® E5 v3 Processors.4) High Performance CUDA AES Implementation: A Quantitative Performance Analysis Approach.5) High-Performance Hardware Implementation for RC4 Stream Cipher.6) New Speed Records for Salsa20 Stream Cipher Using an Autotuning Framework on GPUs.7) AES-NI SSL Performance.8) ChaCha-IP-13 / EIP-13 ChaCha20 accelerators.Эти и другие источники вы можете найти в разделе
Статьи.
2Q2019 Начало проектирования графического процессора на архитектуре MALT.https://sdelanounas.ru/blogs/106294/