
Компания Nvidia анонсировала два новых продукта: GB200 NVL4 — модуль с четырьмя GPU B200 и двумя процессорами Grace, а также H200 NVL PCIe GPU, предназначенный для центров обработки данных с воздушным охлаждением.
Суперчип GB200 Grace Blackwell NVL4 — это ещё более мощная версия стандартного (не NVL4) двухпроцессорного модуля, включающая четыре графических процессора B200 Blackwell, соединённых интерфейсом NVLink, и два процессора Grace на базе ARM, расположенных на одной материнской плате. Решение разработано для гибридных рабочих нагрузок в области HPC и ИИ и включает когерентную память объёмом 1,3 ТБ. По заявлению Nvidia, GB200 NVL4 выдаёт производительность, превышающую показатели его предшественника, Nvidia GH200 NVL4 Grace Hopper Superchip, в 2,2 раза в задачах моделирования, в 1,8 раза при обучении и в 1,8 раза при выводе данных.
Компания утверждает, что суперчип GB200 NVL4 будет доступен во втором полугодии 2024 года у различных поставщиков, включая MSI, Asus, Gigabyte, Wistron, Pegatron, ASRock Rack, Lenovo, HP Enterprise и других.
Другое представленное решение — H200 NVL: двухслотовый GPU с воздушным охлаждением и поддержкой интерфейса PCIe 5.0 (128 ГБ/с). Кулер оптимизирован для монтажа в стойку и выполнен в сквозном дизайне, где воздух подаётся справа налево; вентилятора нет.
Производительность немного ниже, чем у выпущенного ранее H200 от Nvidia в форм-факторе SXM. H200 NVL обеспечивает 30 TFLOPS при вычислениях FP64 и 60 TFLOPS при FP32. Производительность тензорных ядер достигает 60 TFLOPS в FP64, 835 TFLOPS в TF32, 1 671 TFLOPS в BFLOAT16, 1 671 TFLOPS в FP16, 3 341 TFLOPS в FP8 и 3 341 TFLOPS в INT8.
Сервер с Nvidia
Однако Nvidia утверждает, что H200 NVL намного быстрее, чем H100 NVL, который он заменяет. Он имеет в 1,5 раза больший объём памяти и в 1,2 раза большую пропускную способность, обеспечивая до 1,7 раза более высокую производительность при выводе данных (inference) и до 1,3 раза — в задачах HPC. Nvidia также сравнила его с графическими процессорами Ampere, заявив, что H200 NVL в 2,5 раза превосходит аналогичные решения этого поколения.
Графический процессор H200 NVL PCIe оптимизирован для большинства конфигураций центров обработки данных, включая серверные стойки с воздушным охлаждением. По данным Nvidia, около 70 % корпоративных серверных стоек используют воздушное охлаждение и имеют мощность не более 20 кВт.
Поскольку H200 NVL выполнен в формате PCIe, провайдеры центров обработки данных могут повторно использовать существующую инфраструктуру, заменяя только графические процессоры. Это позволяет сократить количество отходов и значительно снизить затраты на обновление оборудования. Кроме того, H200 NVL оснащён интерфейсом NVLink, который обеспечивает пропускную способность до 900 ГБ/с на каждый GPU и позволяет подключать до четырёх графических процессоров в одной стойке для увеличения общей производительности.
Новый графический процессор с воздушным охлаждением появился на фоне серьёзных проблем с перегревом GPU Blackwell. Несмотря на использование систем жидкостного охлаждения, системные интеграторы вынуждены перепроектировать серверные стойки для работы с GPU Blackwell из-за огромного тепловыделения — стойки с такими графическими процессорами могут потреблять до 120 кВт. H200 NVL даже близко не конкурент B200, но GPU Nvidia с воздушным охлаждением для дата-центров подчеркивает значительные преимущества графических процессоров с воздушным охлаждением, потребляющих мало энергии.
H200 NVL будет доступен у таких поставщиков, как Dell, HP Enterprise, Lenovo и Supermicro. Также новый GPU можно будет найти в платформах от Aivres, ASRock Rack, Asus, Gigabyte, Ingrasys, Inventec, MSI, Pegatron, QCT, Wistron и Wiwynn.