
Несколько слов о потреблении энергии
В обзоре Supermicro MegaDC ARS-211M-NR мы подробно рассмотрели энергопотребление используемой нами платформы AmpereOne. Основной вывод заключается в том, что энергопотребление в режиме ожидания оказалось довольно высоким по сравнению с платформой Xeon 6700E или AMD EPYC 9005. Разница составила не 10–20 Вт, а более 70 Вт, что весьма заметно для односокетной системы.
Supermicro AmpereOne OpenBMC потребление в режиме ожидания: 242 Вт
При полной нагрузке с процессором AmpereOne A192-32A мощностью 400 Вт процессор AMD EPYC Turin 9965 потреблял бы больше энергии, но разница не более 100 Вт. Платформа Intel Xeon 6780E — это просто менее энергозатратное решение с TDP 330 Вт. Здесь можно сделать два вывода. Во-первых, AMD и Intel практически нивелировали разрыв с Ampere по показателям производительности на ватт. С другой стороны, процессор AmpereOne, выпущенный в 2022–2023 годах, мог бы быть значительно лучше. Его главная проблема в том, что широкая доступность за пределами облачных провайдеров была достигнута только в 2024 году, поэтому сейчас у него другие конкуренты. Если вам нужны более подробные сведения об энергопотреблении, ознакомьтесь с обзором системы.
Ключевые уроки: конкуренция
На этом этапе стоит обсудить конкуренцию, чтобы сделать основные выводы.
Ключевые уроки: конкуренция с Intel
Во-первых, Intel Xeon 6700E выглядит очень хорошо. Intel конкурентоспособна по производительности. Ядра E от Intel, по крайней мере, сопоставимы с ядрами AmpereOne. Мы могли бы отдать небольшое преимущество AmpereOne, но это будет недальновидно. На данный момент главным преимуществом Ampere остаётся количество ядер: 192 против 144 у Intel Xeon 6700E. Напомним, что эти процессоры разрабатывались с прицелом на размещение как можно большего количества клиентских инстансов <8 vCPU на один сокет. У Ampere больше ядер, и здесь он выигрывает. Тем не менее Intel в значительной степени сократила разрыв.
Ampere AmpereOne Intel Xeon 6700E Sierra Forest 2
С другой стороны, Intel Xeon 6766E — весьма интересная модель. Этот чип с TDP 250 Вт в двухсокетной конфигурации набирает около 1320 баллов в тесте SPEC CPU2017 int_rate, что составляет примерно 660 баллов на процессор против 702 у AmpereOne, но при потреблении 400 Вт. Хотя здесь использовались разные компиляторы, снижение производительности на 6% ради TDP на 150 Вт меньше на один сокет будет оправдано для многих пользователей. Intel проделала отличную работу по сокращению разрыва между потребляемой мощностью и производительностью.
Другой важный аспект — это стоимость. AmpereOne с 192 ядрами стоит менее половины рекомендованной цены Intel Xeon 6780E. Intel нужно пересмотреть свою стратегию ценообразования и скидок, потому что сейчас она выглядит странно.
Мы знаем, что AmpereOne M будет иметь 256 ядер и 12-канальную DDR5. Мы также знаем, что у Intel будет Sierra Forest-AP с 288 ядрами и 12-канальной DDR5. В итоге Intel должна оказаться очень конкурентоспособной, но по более высокой цене. И, пожалуй, самое странное, что следующее поколение Intel — Clearwater Forest — как ожидается, будет направлено на укрепление позиций в линейке процессоров для облачных вычислений.
Ключевые уроки: конкуренция с AMD
Крупные процессоры AMD стоят дороже, но серия AMD EPYC 9005 «Turin» очень хороша. Возможно, на то есть веская причина. По нашему мнению, AmpereOne скорее должен был конкурировать с поколением AMD EPYC 9754 «Bergamo», а не с Turin Dense. Если учесть, что Ampere поставлял AmpereOne таким клиентам, как Oracle Cloud, ещё в 2023 году, то это становится логичным. 8-канальный AmpereOne не был предназначен для конкуренции с 192-ядерным/384-поточным Turin Dense.
AMD EPYC Bergamo Ampere AmpereOne 1
Цены серии Turin у AMD, как и у Intel, значительно выше, чем у AmpereOne. Однако утверждать, что AMD или Intel неконкурентоспособны в этом сегменте, на данный момент сложно. Вероятно, это связано с тем, что нам нужно увидеть AmpereOne M.
Серверы с AMD процессом
Ключевые уроки: конкуренция с NVIDIA
NVIDIA — здесь фактор неопределённости. Мы выпустили материал под названием «Самый важный сервер 2022 года: Gigabyte Ampere Altra Max и NVIDIA A100»; этому серверу даже была посвящена отдельная сессия на GTC (примечание переводчика: GTC — GPU Technology Conference). Теперь, если вы хотите подключить GPU NVIDIA к процессору на базе Arm, скорее всего, это будет Arm-процессор от NVIDIA.
Lenovo HR650N Internal NVIDIA Grace Grace Superchip 1
Можно возразить, что это плохо для Ampere, но возможно это к лучшему. У NVIDIA есть продукт для ИИ, который очень востребован на рынке, и это будет стимулировать переход на Arm. Архитектура Grace — достойная альтернатива процессорам x86 с P-ядрами, особенно при меньшем количестве ядер. Но в сегменте облачных решений с большим количеством ядер NVIDIA пока незначительный игрок даже со своим 144-ядерным Grace Superchip.
Мы не видим AmpereOne как вариант для высокопроизводительных HGX B100/ HGX B200 систем для обучения и инференса. В то же время, NVIDIA, продвигая Arm среди своих клиентов и партнёров, способствует оптимизации приложений для Arm, таких как веб-серверы, на которые нацелен AmpereOne.
По сути, если вы хотите Arm-сервер для локального использования, у вас есть два варианта — NVIDIA и Ampere, и оба поставщика ориентированы на разные уровни производительности на ядро.
Ключевые уроки: конкуренция в облаке
Облако — это настоящее поле битвы для Ampere. Главная проблема Ampere заключается в том, что крупные гиперскейлеры разрабатывают собственные чипы. Такие компании, как Microsoft с Azure Cobalt 100, могут использовать Arm Neoverse CSS для создания своих решений. AWS выходит на новый уровень с Gravito
(Примечание переводчика: Arm Neoverse CSS или Custom Silicon Solutions — это предложение от компании Arm, которое позволяет крупным клиентам, таким как облачные провайдеры и производители оборудования, создавать кастомные процессоры, используя лицензируемую архитектуру Arm Neoverse. Neoverse — это линейка процессорных архитектур Arm, предназначенная для серверных, облачных и телекоммуникационных приложений, где важны высокая производительность и энергоэффективность.)
Amazon AWS Graviton4
Четыре года назад компания Ampere выигрывала у гиперскейлеров благодаря Altra / Altra Max. Теперь ей, вероятно, нужно сосредоточиться на предложении вариантов для миграции на локальные решения. Для сравнения: если у вас есть инстанс на базе Arm в Microsoft Azure, AWS, GCP или Oracle Cloud и вы хотите перенести нагрузку на локальную инфраструктуру или в колокейшн, вам понадобится сервер на Arm. NVIDIA сосредоточена на продаже GPU для искусственного интеллекта, и для этого ей нужен CPU. Вариант переноса облачных рабочих нагрузок на местный сервер несколько странен. У большинства производителей есть платформа NVIDIA MGX для Grace, но это решение для высокой производительности. Если же вы хотите перенести что-то вроде веб-сервера, то реальный вариант — Ampere. Такие компании, как Gigabyte и Supermicro, предлагают платформы на Ampere Altra и AmpereOne. У HPE есть Altra (Max) в HPE ProLiant RL300 Gen11. Если вы пользуетесь решениями Dell или Lenovo (в США), то найти сервер на Arm без NVIDIA сложнее.
AmpereOne фактически имеет этот рынок перед собой. Добиться сделок на несколько процессоров или даже на несколько тысяч процессоров гораздо сложнее, чем заключить сделку на 25 000 процессоров и более. Вопрос теперь в том, начнёт ли Ampere фокусироваться на предложении пути для миграции с облачных инстансов Arm.
Заключительные слова
Итак, AmpereOne самый быстрый процессор, который вы можете купить в 4 квартале 2024 года? Нет, и это не его цель. Он нацелен на то, чтобы стать процессором на базе Arm с 192 ядрами и энергопотреблением чуть более 2 Вт на ядро. Одна из ключевых проблем заключается в том, что мы всегда оцениваем производительность целых процессоров. На практике их используют как облачные инстансы, в основном состоящие из 8 виртуальных процессоров (vCPU) или меньше. Вероятно, такие инстансы работают с низкой загрузкой процессора, и более мощное ядро — просто расточительство.
Ampere AmpereOne A192 32X In Supermicro Socket LGA5964 Open 2
Чтобы получить результаты 1P Ampere Altra Max, мы приобрели сервер ASRock Rack 1U на базе ASRock Rack ALTRAD8UD-1L2T. Это более старое и менее дорогое поколение для одного из наших проектов по хранению данных. В целом, сегодня процессоры Arm достаточно просты в использовании, но нельзя сказать, что стоимость перехода будет нулевой. Стоимость есть, но она значительно ниже, чем раньше. NVIDIA и облачные провайдеры, продвигающие процессоры Arm, со временем будут только способствовать снижению этой стоимости.
В итоге, учитывая, что мы оцениваем процессор 2022–2023 годов в 2024 году, AmpereOne хорош. Но важно отметить, что AmpereOne остаётся единственным доступным вариантом, если вы не гиперскейлер, который может разрабатывать собственные процессоры, но при этом хочет Arm для облачных решений.
Иногда быть единственным в своём классе — это отличное положение.
Перевод статьи.