Татарин>> Ну, то есть, это понимаешь. ОК.Nikita> Что "это" ?
То, что Вы не в зуб ногой в высокопроизводительных вычислениях.
Nikita> Хорошо. Давайте возьмём 480-й. Ой, а в нём 2050
Татарин>> все остальные суперкомпы, построеные на GPU предыдущих поколений вмиг стали бесполезны?Nikita> "Остальные" это какие ?
Это те, которые строятся с 2007-го года.
Вот, например, Tsubame - 29-е место на момент ввода (и мощнейщий на тот момент с GPU).
Для чего его строили, если одинарная точность никому не нужна?
Nikita> Если внезапно образовались копеечные многие-и-многие TFLOPS одинарной точности - грех их не использовать.
Продолжаете доказывать, что ни в зуб ногой в высокопроизводительных вычислениях?

Не нужно, это уже и так всем ясно.

С чего бы вдруг они "образовались", да ещё и "копеечные", если их надо строить и платить затем за аренду, эксплуатацию, охлаждение и энергию?
Они лишь вдвое менее копеечные, чем вычисления с двойной точностью.
Возьмём, скажем, молекулярную динамику (если не знаете - что это, зачем это и кому надо, спросите, я расскажу, или погуглите). Она почти вся бегала в одинарке (двойная точность используется, да, но не то чтоб это основная масса). Двойная точность в куче приложений этой области ничего не даст. А вот
удвоение числа частиц, времени симуляции или, скажем, удешевление+ускорение расчётов
вдвое - это аргумент, который работает всегда. Объясните мне (когда прогуглите о том, что такое МД): на кой хрен пользователям этих расчётов надо платить вдвое больше за двойную точность, если они получают столь же хреновый результат?
...когда могли бы лучший?
Татарин>> , а сейчас вдруг исчезла? куда эта потребность делась?Nikita> Полностью она, разумеется, не исчезла. Но баланс затрат изменился существенно. Многие теперь могут позволить себе и в двойной считать.
Похоже, Вы ничего не понимаете в вычислениях вообще.
ВСЕГДА считают с требуемой, с достаточной точностью. Избыточно, без необходимости увеличивать вдвое размер представления величин (ценой снижения производительности) - это СНИЖАТЬ реальную точность вычислений (скажем, в вышепомянутом примере с МД это означает при прочих равных вдвое меньшее количество частиц в ансамбле или упрощеные формулы взаимодействия и т.п.)
Короче, Вам бы больше читать, не писать, честное слово.
Татарин>> Капитан намекает, что слово "полноценных" было категорически неуместно.Nikita> Почему ? Ещё раз повторяю: такая схема соответствует определению пиковых FLOPS.
Ну да. А это и не оспаривается.
Я, собссно, против слова "полноценный". У нас контекст-то был какой? Мы сравнивали производительность (замечу, не заявленую, а реальную производительность).
Татарин>> Я намекаю, что у Эльбруса исполнительные блоки более универсальны.Nikita> Поехали по-кругу. Что значит "более универсальны" ? У "Эльбруса-4С" MUL может на ходу становиться ADD и наоборот ?
Значит, что нет ИУ, которое выполняет отдельно только сложение или только умножение (как у ИНтел), ИУ "Эльбруса" болеее универсальны - могут выполнять и то, и то, в зависимости от потребности алгоритма.
По абстрактной пиковой производительности ни один ЦПУ со (сравнимых размеров/потребляемой мощности) спецвычислителем сравняться не может. Но ЦПУ используют именно потому, что пиковую производительность тех же видеокарт на многих реальных задачах попросту не реализовать.
Понимаете, почему эти интеловкие цифры пиков более "бумажные"? или нет?
Татарин>> И на любой реальной задаче обещаной Вами "разницы в 2 раза" не будет от слова "совсем" уже только за счёт этого.Nikita> Лично я полагаю, что будет существенно более чем в 2 раза.
Это уже совершенно ясно, что Вы там полагаете.

Сейчас вопрос лишь в том, поймёте ли Вы насколько бредовы Ваши предположения или в очередной раз не поймёте.
Татарин>> А TDP Вы обсуждаете вовсю, и я понимаю, почему Вам не хочется сравниватьNikita> И почему же ? Может потому, что я хочу снова посадить Вас в лужу ? 
Ну, потому что сравнение для Вас провальное совершенно, других поводов у Вас тут быть не может. Или 130Вт TDP на 45нм лучше, чем 60Вт на (библиотечных) 65нм?
Татарин>> Эльбрус с Ксеоном (опережающим по технологии на поколение!) по этому параметру.
Nikita> Раз Вы настаиваете, то "их есть у нас": L5520, 60 Вт, 36+ GFLOPS.
Что "есть у нас"? L5520 - 45нм, как и вышепомянутый Ксеон.
Татарин>> Ну, насчёт "легко", я думаю, инженеры Интела бы поспорили. Nikita> Я так и знал, что по теме возражений не будет.
Возражений чему? Это же идеальная иллюстрация моей мысли.
80% от пика на
идеальной для данной архитектуры синтетике - это "нет проблем"?
Татарин>> Не винда ж гоняться будет. Математика.Nikita> Угу-угу. На процессоре с аппаратной поддержкой двоичной трансляции x86 
?
Какая связь?
Гоняться-то будет родной код.
Nikita> Я так и знал, что по вопросу изменяемого разделяемого состояния возражений не будет.
А с чего бы?