Татарин> Тогда вопрос: вот эти самые задаче-ориентированные вычислители - это блоки какой сложности?
Татарин> Ну вот применительно к нейросетям - что там может быть? просто блок с ММАС? блок, который делает много ММАС с вектора? что-то более сложное?
Задумка такая, что любой каприз за ваши деньги
Вот пример одного из таких:
Фото: maltsystem.com
Начато проектирование процессора 2-ого поколения. Спроектирована первая версия процессорного элемента (ПЭ), архитектура которого является развитием архитектуры Леопард. Проведено тестирование и замер энергопотребления на целевых алгоритмах с учётом временных задержек в САПР Cadence на частоте 1 ГГц для техпроцесса TSMC HPC+ 28 nm.
Разработанный ПЭ второго поколения превосходит ПЭ первого поколения по быстродействию на ядро в 3-6 раз (в зависимости от алгоритма), по быстродействию на единицу площади - в 3-8 раз, по энергоэффективности ПЭ - в 1.5-3 раза.
// Дальше — maltsystem.ru
Он не Тьюринг-полный, но довольно умный, есть компилятор. Пока мы в основном занимались целочисленными задачами, всякие блокчейны и базы данных, но планы на плавающую точку и глубокое обучение есть и развиваются. Без них у меня диссертация не получится
Но делать тупо MMAC для нас нецелесообразно, по сравнению с видеокартами слишком маленькая глотка наружу. Так что наша цель алгоритмы, которые надо долго жевать, пользуясь локальными данными. А то, что всё это управляется RISC-процессорами, позволяет программировать всё это дело на плюсах. Плюс есть и вполне себе развивается поддержка OpenCL. Подробнее про софт вот тут:
Мы уверены, что вы имеете опыт работы с коммерчески доступными x86/GPU/ARM вычислительными системами на языках С/С++. Скорее всего, вы программировали GPU на специализированных языках типа OpenCL или CUDA. Очень вероятно, что как для универсальных, так и для графических процессоров вы использовали специальные, ориентированные на конкретное “железо”, приемы для повышения производительности работы вашего кода. И, как любому программисту, вам бы хотелось, с одной стороны, “поменьше копаться в железе” и использовать уже изученные, привычные для вас, языки программирования, с другой - “выжать из оборудования все, на что оно способно”, и получить действительно быстрый и/или, в зависимости от требования заказчика, энергоэффективный код.
// Дальше — maltsystem.ru
Ну и вообще, повторюсь, любой каприз за ваши деньги. Там на сайте есть контакты директора и менеджера, если нужна информация более официального уровня - спокойно пиши, ответят. А не ответят - я их попинаю. А если тебе надо сваять интересный чип - точно пиши, я люблю делать процессоры