Atlas 800I A3 - это стоечный AI-сервер форм-фактора 10U, построенный на NPU Ascend 910C Atlas A3 Reasoning и четырёх процессорах Kunpeng 920, ориентированный на высокоплотный Инференс / Развертывание (Inference) в дата-центрах. На одной машине может работать до 8 процессоров Ascend 910, а несколько таких серверов объединяются в суперузел с суммарно 384 картами, что делает платформу подходящей для крупных AI-сервисов и централизованных LLM-шлюзов.
Каждый Atlas 800I A3 оснащён восемью модулями встроенной памяти по 128 ГБ (HBM) с суммарной пропускной способностью до 3,2 ТБ/с, обеспечивая вычислительную мощность до 4,48 PFLOPS в FP16 и 8,96 POPS в INT8. Межсоединение D2D с пропускной способностью 784 ГБ/с в обоих направлениях позволяет эффективно масштабировать инференс и RAG-системы (Retrieval-Augmented Generation) внутри узла и между узлами суперкомпьютерного уровня, минимизируя задержки между NPU.
Системная часть включает 32 слота DDR5-памяти (до 5200 МТ/с, один модуль - до 64 ГБ), локальное хранилище 2× 2.5" SATA + 8× 2.5" NVMe, до 5 слотов расширения PCIe 5.0. Внешняя сеть реализована через 8× 400GE QSFP - это RoCE/Ethernet-плоскость для подключения к датацентровой сети и внешним сервисам, а 56× 400GE QSFP работают как фабрика LingQu для межсоединения NPU внутри всего A3-кластера, образуя высокопроизводительную внутреннюю шину для распределённого инференса.
Шесть блоков питания по 3,0 кВт с горячей заменой и резервированием 5+1, питание от 220 В AC или 336/240 HVDC, воздушное охлаждение с пятью модулями вентиляторов (4+1, hot-swap) и максимальная потребляемая мощность до 14,6 кВт обеспечивают работу в режиме круглосуточного продакшн-инференса. Платформа заточена под стек Ascend (CANN, MindSpore, PyTorch-Ascend) и предназначена прежде всего для долгоживущего Инференса / Развертывания (Inference) и высоконагруженных AI-сервисов, а не для классического CUDA-обучения.
Производительность GPU
| Тип точности | Совокупная мощность восьми Ascend 910C Reasoning |
| FP32 | 1.20 PFLOPS |
| FP16 | 4.48 PFLOPS |
| INT8 | 8.96 POPS |
Совместимость с LLM-моделями
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1 685B |
Нет |
Примерно 689GB |
✅ |
Запускается на суперузле Atlas 800I A3 с несколькими узлами; ориентирована на сложные reasoning-сценарии и длинный контекст. |
| Qwen3.5-397B-A17B |
Нет |
Примерно 807GB |
✅ |
Хорошо масштабируется по NPU Ascend 910C и узлам кластера Atlas 800I A3; подходит для продакшн-чатов, агентов и RAG. |
| Gpt-oss:120b |
Нет |
Примерно 196GB |
✅ |
Эффективно использует память Ascend 910C на Atlas 800I A3; удобно для больших батчей и длинных диалогов без квантизации. |
| GigaChat3-702B-A36B-preview |
Нет |
Примерно 720GB |
✅ |
Ориентирован на использование ресурсов суперузла Atlas 800I A3; подходит для крупных ассистентов и генерации очень длинных контекстов. |
| Mistral-Large-3-675B-Instruct-251 |
Нет |
Примерно 682GB |
✅ |
Оптимальна для reasoning- и аналитических задач на NPU Ascend 910C в кластере Atlas 800I A3, включая RAG и интеллектуальных агентов. |
| GLM-5-GGUF |
Q4_K_M |
Примерно 456GB |
✅ |
Эффективно задействует ресурсы Atlas 800I A3 без квантизации; подходит для reasoning-задач, RAG и промышленных LLM-сервисов. |
Совместимость с диффузионными моделями
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 |
Текст в изображение |
✅ |
Надёжное качество; на Atlas 800I A3 можно вести генерацию высокого разрешения и многопользовательские пайплайны. |
| Flux.2-dev |
Текст в изображение |
✅ |
Требует ~178GB VRAM; на Atlas 800I A3 удобно запускать несколько параллельных пайплайнов для генерации high-res изображений и больших батчей. |
| SD Turbo |
Быстрые предпросмотры |
✅ |
Максимальная скорость итераций и серийных кадров на Ascend 910C; подходит для прототипирования и online-предпросмотров. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers |
Текст в изображение |
✅ |
Лёгкая версия Kandinsky 5.0 (~35GB VRAM); на Atlas 800I A3 есть большой запас по памяти для высокого разрешения и плотных батчей. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers |
Текст в видео |
✅ |
Модель T2V (~29GB VRAM) для роликов до ~5 секунд; на Atlas 800I A3 легко масштабируется по нескольким NPU для пакетной генерации видео. |
Технические характеристики
| Видеокарта | 8x Ascend 910C Reasoning 128GB HBM |
| Процессор | 4x Kunpeng 920 (64c/64t, 2.6Ghz, 180W)
|
| Оперативная память | 2TB DDR5 ECC REG возможно увеличить до 4TB |
| Сетевые карты | 8x 400Gbe QSFP интерфейс прямого выхода, протокол RoCE
56x 400Gbe QSFP интерфейс прямого выхода, протокол Lingqu |
Нажимая кнопку «Отправить», я даю согласие на обработку и хранение персональных данных и принимаю соглашение