Nec SX1280
тел. +7(499)347-04-82
Описание Nec SX1280
Отличный выбор! NEC SX1280 — это легендарный суперкомпьютер, олицетворявший пик векторной обработки в конце 1980-х — начале 1990-х годов. Вот подробное описание.
Общее описание
NEC SX1280, представленный в 1994 году, был флагманской моделью в линейке суперкомпьютеров SX-4. Он стал кульминацией развития чисто векторной архитектуры NEC, известной своей исключительной производительностью на задачах с высокой степенью параллелизма данных (научные расчеты, моделирование климата, аэродинамика, квантовая химия и т.д.).
Это была массивно-параллельная векторная система (Massively Parallel Vector Processor). В отличие от более ранних моделей SX-3, которые были многопроцессорными системами с общей памятью, SX1280 сочетал в себе множество векторных узлов, соединенных высокоскоростной коммуникационной сетью (интерконнектом), что позволяло масштабироваться до огромного количества процессоров.
Ключевая философия: достижение максимально возможной пиковой производительности за счет:
- Сверхвысокой векторной производительности каждого процессора.
- Очень высокой пропускной способности памяти (знаменитая "сбалансированная" архитектура NEC, где скорость памяти соответствовала скорости процессора).
- Массивного параллелизма между сотнями таких процессоров.
Технические характеристики
- Архитектура: Массивно-параллельная векторная (MPP) с распределенной памятью.
- Пиковая производительность системы: До 1.02 TFLOPS (1 триллион операций с плавающей запятой в секунду). Это сделало его первым суперкомпьютером в Японии, преодолевшим терафлопсный барьер.
- Состав системы:
- Состоял из множества вычислительных узлов (Compute Nodes, CN).
- Каждый узел — это, по сути, мощный векторный компьютер.
- Процессор (на узел):
- Тип: Векторный процессор NEC.
- Пиковая производительность на процессор: 2.0 GFLOPS (для 64-битной арифметики).
- Векторные регистры: 8 КБ.
- Векторные конвейеры: Множественные, для разных операций (сложение/умножение, деление, логические операции, загрузка/сохранение).
- Конфигурация узлов:
- Каждый вычислительный узел (CN) содержал 4 или 8 векторных процессоров, работающих с общей памятью (Shared Memory) внутри узла.
- Таким образом, производительность одного узла (8 процессоров) достигала 16 GFLOPS.
- Память:
- На узел (8 CPU): До 2 ГБ оперативной памяти с чрезвычайно высокой пропускной способностью.
- Пропускная способность памяти на узел: 256 ГБ/с — феноменальный показатель даже по современным меркам, который и обеспечивал эффективную работу векторных конвейеров.
- Общий объем памяти системы: Мог достигать сотен ГБ.
- Системная интерконнекция:
- Для связи между 128-ю вычислительными узлами использовалась высокоскоростная сеть "Интерконнект SX-4" с топологией "перекрестный коммутатор" (Crossbar Switch).
- Пропускная способность интерконнекта: Около 200 МБ/с на канал в каждом направлении с очень низкой задержкой.
- Операционная система: SUPER-UX — проприетарная ОС на основе UNIX System V, оптимизированная для векторных и параллельных вычислений.
- Компиляторы: Fortran, C, C++ с поддержкой автоматической векторизации и распараллеливания (директивы OpenMP-like и MPI).
- Габариты и энергопотребление: Занимал несколько десятков стоек (модель SX-4/128 состояла из 32 стоек), требовал мощного водяного охлаждения и имел огромное энергопотребление (сотни кВт).
Парт-номера и модели
Важно понимать, что SX1280 — это не одно конкретное устройство, а архитектурное обозначение максимальной конфигурации в серии SX-4. Коммерческое название — NEC SX-4.
Основные парт-номера и конфигурации в линейке SX-4:
-
SX-4/Model A, B, H (одноузловые системы):
- SX-4A: 1 узел с 1-4 векторными процессорами (пик: 2-8 GFLOPS).
- SX-4B: 1 узел с 4 процессорами (8 GFLOPS).
- SX-4H: 1 узел с 8 процессорами (16 GFLOPS). Это и есть базовый вычислительный узел (CN), из которых собирался SX1280.
-
SX-4/Model M (массивно-параллельные системы): Состояли из множества узлов Model H, соединенных интерконнектом.
- SX-4/32: 32 узла (256 процессоров) -> 512 GFLOPS.
- SX-4/64: 64 узла (512 процессоров) -> 1 TFLOPS. Это и есть система, которая чаще всего ассоциируется с названием SX1280 (1280 = 64 узла * 20 GFLOPS? Нет, скорее маркетинговое округление от 128 процессоров в ранних планах, но фактически 512 CPU). Иногда название SX1280 прямо указывало на систему с 128 узлами (1024 процессора) в планируемых конфигурациях.
- Существовали и другие конфигурации (4, 8, 16, 128 узлов).
Парт-номера компонентов:
- Векторный процессор: Специальные VLSI-чипы, разработанные NEC. Конкретные номера микросхем — проприетарная информация NEC.
- Модули памяти: Специализированные высокоскоростные модули.
Совместимые и последующие модели
-
Предшественники:
- NEC SX-3 (представлен в 1990) — архитектура с общей памятью (SMP). Был основным конкурентом Cray Y-MP и C-90.
- NEC SX-1, SX-2 — более ранние векторные системы 1980-х.
-
Прямые наследники (эволюция архитектуры):
- NEC SX-5 (1998) — дальнейшее развитие, до 4 процессоров на узел, пиковая производительность процессора до 8 GFLOPS. Системы масштабировались до 512 узлов (TFLOPS-диапазон).
- NEC SX-6 (2001), SX-7 (не выпускался), SX-8 (2004), SX-9 (2008) — продолжали традицию, увеличивая тактовую частоту, плотность и производительность на чип. SX-9 представил первый в мире векторный процессор с производительностью > 100 GFLOPS на одном ядре.
- NEC SX-ACE (2013) и NEC SX-Aurora TSUBASA (2018) — современные воплощения. SX-Aurora представляет собой революционный дизайн: векторные ускорители (Vector Engine, VE) в формате PCIe-карт, управляемые стандартными x86-серверами, с фокусом на высокую пропускную способность памяти (1.2 TB/s на VE).
Совместимость: В рамках одной серии (например, SX-4) сохранялась бинарная совместимость. Переход между крупными поколениями (SX-3 -> SX-4 -> SX-5) обычно требовал перекомпиляции кода, но благодаря поддержке стандартных языков (Fortran, C) и директив перенос кода был относительно простым для векторных приложений.
Историческое значение
NEC SX1280 (SX-4/128) закрепил за NEC лидерство в области векторных вычислений в середине 1990-х. Он демонстрировал, что массивно-параллельный векторный подход является жизнеспособным путем к терафлопсной производительности. Многие его архитектурные принципы — баланс между процессором и памятью, важность высокоскоростного интерконнекта — остаются актуальными в современных суперкомпьютерах, таких как Fugaku (разработанный RIKEN и Fujitsu, унаследовавший многие черты от векторных машин).