... сайт создании супер компа на коленках.

Оценки производительности суперЭВМ

Поскольку суперкомпьютеры традиционно использовались для выполнения
вычислений над вещественными числами, большинство сегодняшних оценочных
характеристик производительности связано именно с этими вычислениями.
Прежде всего, к ним относится пиковая производительность, измеряемая в млн.
операций с плавающей точкой, которые компьютер теоретически может выполнить
за 1 сек (MFLOPS). Пиковая производительность - величина, практически не
достижимая. Это связано, в частности, с проблемами заполнения
функциональных конвейерных устройств, что является типичным не только для
векторных суперЭВМ, но и для компьютеров на базе микропроцессоров RISC-
архитектуры. Особенно важно это для суперконвейерной архитектуры
микропроцессоров, например, DEC Alpha, для которой характерно применение
относительно длинных конвейеров. Понятно, что чем больше конвейер, тем
больше надо "инициализационного" времени для того, чтобы его заполнить.
Такие конвейеры эффективны при работе с длинными векторами. Поэтому для
оценки векторных суперЭВМ было введено такое понятие, как длина
полупроизводительности - длина вектора, при которой достигается половина
пиковой производительности .
Более реальные оценки производительности базируются на временах выполнения
различных тестов. Конечно же, самыми хорошими тестами являются реальные
задачи пользователя. Однако такие оценки, во-первых, весьма специфичны, а,
во-вторых, часто вообще недоступны или отсутствуют. Поэтому обычно
применяются более универсальные тесты, однако традиционные методики оценки
производительности микропроцессоров - SPEC- в мире суперкомпьютеров, как
правило, не используются. Это связано, в частности, с их малой
информативностью - особенно SPEC 92 - для суперкомпьютерных приложений,
хотя новый стандарт SPEC 95 дает более реальную картину производительности.
Сегодня имеются оценки SPEC только для суперкомпьютеров, использующих
микропроцессоры RISC-архитектуры. Недавно был анонсирован специальный новый
стандарт SPEChpc96 для высокопроизводительных вычислений .
Поскольку большую часть времени выполнения программ обычно занимают циклы,
иногда именно они применяются в качестве тестов, например, известные
ливерморские циклы. Наиболее популярным тестом производительности на
сегодня следует признать Linpack, который представляет собой решение
системы И линейных уравнений методом Гаусса. Поскольку известно, сколько
операций с вещественными числами нужно проделать для решения системы, зная
время расчета, можно вычислить выполняемое в секунду количество операций.
Имеется несколько модификаций этих тестов. Обычно фирмы-производители
компьютеров приводят результаты при N 100. Свободно распространяется
стандартная программа на Фортране, которую надо выполнить на
суперкомпьютере, чтобы получить результат тестирования. Эта программа не
может быть изменена, за исключением замены вызовов подпрограмм, дающих
доступ к процессорному времени выполнения. Другой стандартный тест
относится к случаю N = 1000, предполагающему использование длинных
векторов. Эти тесты могут выполняться на компьютерах при разном числе
процессоров, давая также оценки качества распараллеливания.
Для MPP-систем более интересным является тест Linpack-parallel, в котором
производительность измеряется при больших И и числе процессоров. Здесь
лидером является 6768-процессорный Intel Paragon (281 GFLOPS при N =
128600). Что касается производительности процессоров, то при N = 100
лидирует Cray T916 (522 MFLOPS), при N = 1000 и по пиковой
производительности - Hitachi S3800 (соответственно 6431 и 8000 MFLOPS). Для
сравнения, процессор в AlphaServer 8400 имеет 140 MFLOPS при N =100 и 411
MFLOPS при N=1000.
Для высокопараллельных суперкомпьютеров в последнее время все больше
используются тесты NAS parallel benchmark, которые особенно хороши для
задач вычислительной газо- и гидродинамики. Их недостатком является
фиксация алгоритма решения, а не текста программы.