
В текущем месяце правительство США расширило запрет на экспорт ИИ-ускорителей в Китай, в том числе распространив его на чип NVIDIA H20. Практически сразу после этого Huawei анонсировала Ascend 920 — ускоритель следующего поколения для работы с искусственным интеллектом, что демонстрирует решимость Huawei стать ведущим поставщиком аппаратного обеспечения в регионе. По сообщениям СМИ, старт массового производства Ascend 920 можно ожидать во второй половине 2025 года. Эксперты считают, что он сможет заменить ускорители NVIDIA H20, которые теперь стали недоступны китайским компаниям, так как обладает сопоставимой производительностью.
ИИ-ускорители NVIDIA H20
Чип NVIDIA H20 оставался весьма популярным выбором среди китайских компаний, даже несмотря на урезанную по сравнению с новейшими решениями компании производительность.
Примечание! ИИ-ускоритель H20 был специально создан NVIDIA для китайского рынка и представляет собой упрощенный вариант NVIDIA H100. Компания начала предлагать китайским клиентам ускоритель H20, специально разработанный таким образом, чтобы не попасть под действие санкций США и соответствовать правилам экспортного контроля, в феврале 2024 года.
NVIDIA заработала миллиарды долларов на продажах этого ускорителя с урезанным функционалом в Китае, причём выручка, согласно последним данным, росла примерно на 50% ежеквартально. Однако, всё хорошее имеет свойство заканчиваться, и теперь, по оценкам, NVIDIA может потерять $5,5 млрд из-за остановки продаж.
NVIDIA H20. Источник изображения: NVIDIA
Технические характеристики Ascend 920
Введенные ограничения открывают огромные возможности для Huawei, которая годами стремилась догнать NVIDIA в области ИИ-ускорителей. Нынешний чип компании, Ascend 910C, демонстрирует около 60% от производительности NVIDIA H100 в задачах логического вывода (инференса).
Новая же модель Ascend 920, созданная по 6-нанометровому техпроцессу SMIC (что стало улучшением в сравнении с 7-нм техпроцессом ускорителя Ascend 910C), как ожидается, превзойдёт показатели в 900 терафлопс и получит пропускную способность памяти 4 ТБ/с благодаря модулям HBM3. При этом, Huawei сделала особый акцент на том, чтобы вся производственная цепочка была полностью «внутренней». Кроме того, вариант Ascend 920C, оптимизированный для моделей Transformer и Mixture of Experts, по сообщениям, показывает производительность на 30–40% выше предшественника. Теоретически, это позволяет новому ускорителю Huawei превзойти NVIDIA H20. Однако, для подтверждения этих оценок необходимо дождаться независимых тестов Ascend 920C.
Анонс Ascend 920 удивил некоторых отраслевых экспертов, особенно если учесть, что он появился сразу после запрета Белого дома на поставки NVIDIA H20 и AMD MI308 в Китай. Ещё более примечательно то, что президент США Дональд Трамп приостановил запланированный запрет на экспорт H20 после встречи с главой NVIDIA Дженсеном Хуангом - при том, что расширение экспортных ограничений готовилось уже несколько месяцев. Именно поэтому Huawei, вероятно, давно ожидала такого развития событий и тайно работала над Ascend 920, дожидаясь официального объявления запрета, чтобы оперативно представить свой ответ.
AI CloudMatrix от Huawei
Помимо Ascend 920, Huawei также представила своё новое решение AI CloudMatrix 384. Эта система на базе ускорителей Ascend 910C, как утверждается, превосходит передовое решение NVIDIA GB200 NVL72 по производительности. Однако, CloudMatrix от Huawei требует гораздо больше энергии - в 4 раза больше чем GB200. Тем не менее, данная разработка лишний раз подтверждает амбиции Huawei в области ИИ, и скорее всего привлечет внимание китайских компаний на фоне ужесточения мер в Сингапуре, Малайзии и других странах против контрабанды санкционных чипов в Китай.
Источники: Tom’s Hardware, WCF Tech