
NVIDIA представила новый элемент в семействе технологий NVLink — NVLink Fusion. И это, пожалуй, один из самых интересных шагов компании за последнее время, так как данная технология открывает экосистемы NVLink для сторонних CPU и ускорителей, предоставляя возможность для их взаимодействия с собственными чипами NVIDIA. Конечно, это нельзя назвать гибкой экосистемой формата «собирай как хочешь» — в любом случае требуется наличие чипов NVIDIA — однако цель заключается в том, чтобы партнеры компании начали создавать решения, сочетающие железо NVIDIA и собственные разработки.
Еще до приобретения сетевого производителя Mellanox NVIDIA развивала собственные технологии локальных сетей и интерконнекта, включая стандарт NVLink. Впервые представленный в архитектуре Pascal в 2016 г., NVLink стал альтернативой PCI-Express в качестве более высокоскоростного соединения между GPU. За прошедшие годы NVIDIA значительно увеличила пропускную способность NVLink, расширив его возможности за счет коммутаторов NVLink и поддержки электрического соединения соседних узлов в стойке. Сегодня компания считает NVLink одной из важнейших своих технологий, поскольку она позволяет масштабировать GPU-системы до уровня целой стойки, делая возможными решения вроде NVL72, включающие в себя 72 GPU.
Теперь NVIDIA планирует сделать следующий шаг с NVLink, удовлетворив запросы клиентов на гибкость через частичное открытие экосистемы для пользовательских решений. Если сейчас NVLink используется исключительно в системах на чипах NVIDIA (в основном в конфигурациях Grace Hopper и Grace Blackwell, сочетающих CPU и GPU), то теперь экосистема NVLink откроется для пользовательских проектов, позволяя вендорам заменять CPU или GPU NVIDIA собственными решениями. Технология получила название NVLink Fusion, отражающее возможность «встраивания» сторонних чипов в сети NVLink.
Подключение сторонних процессоров к GPU NVIDIA через C2C
Если копнуть глубже, под брендом NVLink Fusion на самом деле скрываются две разные технологии. Первая — поддержка CPU, позволяющая подключать сторонние процессоры к GPU NVIDIA через вариант NVLink для чиплетных соединений, NVLink C2C. Строго говоря, именно эту технологию нельзя назвать новинкой: NVIDIA открыла доступ к NVLink C2C для интеграции с пользовательскими чипами еще на GTC 2022, так что сейчас речь идет скорее о развитии данной программы. Пока ни один сторонний чип с поддержкой NVLink C2C (официально) не анонсирован, но цикл разработки таких решений занимает годы, поэтому работа над первыми CPU с NVLink Fusion могла быть начата ещё в рамках старой программы.
Так или иначе, NVIDIA возобновляет усилия по продвижению NVLink C2C для сторонних CPU под брендом NVLink Fusion. Технология относительно проста: вендоры лицензируют NVLink C2C и интегрируют его в свои чипы для соединения с GPU NVIDIA. Такие пользовательские чипы заменят Grace CPU в текущих решениях GB200/GB300, взяв на себя их функции. Ранее для подключения высокопроизводительных GPU NVIDIA требовались PCIe-версии карт (которые, кажется, полностью исчезли), так что это новая итерация таких гибридных систем.
Добавление NVLink 5 в сторонние ускорители
Более интересная и новая часть анонса NVLink Fusion — возможность подключения CPU NVIDIA к сторонним GPU и ускорителям. Сейчас это невозможно на многих уровнях: кроме собственных GPU Hopper и Blackwell, нет ускорителей с NVLink C2C для соединения с Grace, а полнофункциональные PHY NVLink 5 (позволяющие подключать узлы Grace Hopper/Grace Blackwell к сети NVLink) есть только в этих GPU. В общем, подключить сторонний ускоритель к сети NVLink раньше было невозможно, не говоря уже о интеграции с Grace CPU.
NVIDIA решила, что пришло время изменить ситуацию, и сделать это при помощи чиплетов. Компания разработала чиплет NVLink 5, предназначенный для интеграции в пользовательские ускорители. Важно отметить, что NVIDIA не лицензирует NVLink 5 для реализации сторонними производителями — высокопроизводительная технология компании остаётся проприетарной. Однако, следуя идее комбинирования для создания более крупных процессоров, компания предоставляет производителям чипов возможность добавить NVLink 5 через чиплет NVIDIA.
На данный момент NVIDIA не раскрывает технические характеристики чиплета. Неизвестно, какого он размера, сколько потребляет энергии, сколько линий NVLink доступно через чиплет (и, следовательно, через пользовательский ускоритель — будет ли это сопоставимо с GPU GB200?). Также компания не уточнила, какая технология будет использоваться для соединения чиплета NVLink с остальной частью ускорителя — NVLink C2C (уже необходимый для подключения CPU) или другая. Тем не менее, если вы разрабатываете высокопроизводительный ускоритель и хотели бы подключить его к сети NVLink, NVIDIA наконец создала такую возможность.
Без железа NVIDIA будет не обойтись
NVIDIA ясно дала понять, что NVLink Fusion будет работать по принципу «или/или». То есть, её можно использовать для интеграции пользовательского CPU или пользовательского GPU, но не обоих сразу. Таким образом, производители систем не смогут создавать системы с поддержкой NVLink, используя и сторонние CPU, и сторонние GPU — в каждом узле должен оставаться хотя бы один чип NVIDIA.
Пока это выглядит скорее как лицензионное ограничение, а не техническое. Поскольку основная нагрузка по работе с NVLink 5 ложится на GPU — будь то GPU NVIDIA или ускоритель с чиплетом NVLink Fusion — CPU не играет ключевой роли в активации NVLink 5 (и даже не использует его). Однако, вполне очевидно, что NVIDIA совсем не заинтересована в том, чтобы полностью исключать себя из будущих систем. Даже предложение заменять свои GPU сторонними ускорителями — смелый шаг, учитывая, что именно GPU приносят компании основную прибыль.
Тем не менее, можно предположить, что партнёры NVIDIA активно требовали гибкости в проектировании стоек. Grace Blackwell — не универсальное решение, особенно в условиях неопределённого будущего AI-ускорителей. Какой бы ни была причина, итог один: NVIDIA наконец открывает NVLink для сторонних компаний — хотя бы частично.
Пока основными бенефициарами станут Alchip, AsteraLabs, Marvell и MediaTek — все они подтвердили разработку собственных ускорителей или участие в создании решений с NVLink Fusion. Fujitsu и Qualcomm также заявили о работе над новыми CPU с поддержкой NVLink Fusion для совместного использования с GPU NVIDIA. Это включает следующее поколение высокопроизводительного Armv9-процессора Fujitsu, Monaka, и пока безымянный CPU Qualcomm для дата-центров. Кроме того, Cadence и Synopsys участвуют в программе NVLink Fusion как технологические партнёры, предоставляя свои IP-блоки и услуги проектирования компаниям, разрабатывающим аппаратуру с поддержкой NVLink Fusion.