Huawei Atlas 800T A2 - это 4U AI-сервер для Обучения моделей (Training) и Дообучения моделей (Fine-tuning) на базе четырёх процессоров Kunpeng 920 и восьми NPU Ascend 910B. Он рассчитан на разработку и тренинг крупных моделей в областях вроде умных городов, финансов, образования и науки, где требуется высокий объём вычислений и пропускная способность.
Конфигурация с 8×Ascend 910B (по 64 ГБ HBM на NPU) даёт до 512 ГБ ускоренной памяти и суммарную производительность до 3,0 PFLOPS в FP16 и 6,0 POPS в INT8, что подходит как для полноценных тренировочных запусков, так и для тяжёлого Инференса / Развертывания (Inference) и RAG-систем (Retrieval-Augmented Generation) на 100B+ LLM. Исследовательские работы показывают использование Atlas 800T A2 с Ascend 910B3 в качестве базовой платформы для обучения и оценки больших языковых моделей и MoE-архитектур.
До 32 слотов DDR4-3200 (16/32/64 ГБ на модуль) позволяют собрать до 2 ТБ системной памяти - этого хватает для больших индексов, KV-кэшей и сложных пайплайнов Анализа данных (Data Science). Гибкое локальное хранилище (варианты сочетаний SATA и NVMe 2.5″) плюс поддержка RAID 0/1/5/6/10/50/60 закрывают сценарии хранения датасетов и чекпоинтов
Восемь портов 200GE QSFP с RoCE и до трёх слотов PCIe 4.0 дают высокую сетевую плотность и возможность расширения под скоростные адаптеры и специализированные карты. Сервер работает в экосистеме Ascend (CANN, MindSpore, torch-npu, lmdeploy, vLLM-Ascend и т.п.), поэтому ориентирован на стек Huawei вместо CUDA/ROCm, но при этом уже активно используется для развёртывания и обучения LLM в продакшн-проектах.
Четыре блока питания по 2,6 кВт с горячей заменой и схемой 2+2, восемь вентиляторных модулей с N+1-резервированием и воздушное охлаждение обеспечивают надёжную работу при длительных тренировках и высоких нагрузках в ЦОД.
Производительность GPU
| Тип точности | Совокупная мощность восьми Ascend 910B |
| FP32 | 0.792 PFLOPS |
| FP16 | 3.008 PFLOPS |
| INT8 | 6.016 POPS |
Совместимость с LLM-моделями
| Модель |
Тип квантизации |
Требуется VRAM |
Совместимость |
Примечание |
| DeepSeek-R1-GGUF 671B |
Q4_K_M |
Примерно 404GB |
✅ |
Требует аккуратной раскладки весов и ограничения batch/контекста: на 8×Ascend 910B (512ГБ HBM) запуск возможен за счёт агрессивной оптимизации и/или offload, подходит для офлайн-инференса и экспериментов. |
| Qwen3.5-397B-A17B-GGUF |
Q4_K_M |
Примерно 241 GB |
✅ |
Оптимальна для reasoning-задач и аналитики на Atlas 800T A2: комфортно размещается в 512ГБ HBM и масштабируется по всем 8 NPU для снижения латентности и увеличения пропускной способности. |
| gpt-oss-120b |
Нет |
Примерно 196GB |
✅ |
Даёт высокую скорость отклика и стабильность на Ascend 910B; остаётся большой запас HBM для RAG-индексов, длинного контекста и параллельного запуска нескольких инстансов в продакшн-сервисах. |
| GigaChat3-702B-A36B GGUF |
Q4_K_M |
Примерно 427GB |
✅ |
Подходит для сложных русскоязычных ассистентов, аналитики и генерации длинных текстов; на Atlas 800T A2 хорошо работает в Q4_K_M с распределением по 8 Ascend 910B для устойчивого продакшн-инференса. |
| Mistral-Large-3-675B GGUF |
Q4_K_M |
Примерно 404GB |
✅ |
Многоязычная модель для reasoning-задач, RAG-сценариев и интеллектуальных агентов; на Atlas 800T A2 можно как дообучать, так и развёртывать в виде высоконагруженного сервиса. |
| GLM-5-GGUF |
Q4_K_M |
Примерно 456GB |
✅ |
Уверенно работает на 8×Ascend 910B и подходит для многоязычных ассистентов, аналитики и производственных LLM-сервисов. |
Совместимость с диффузионными моделями
| Модель |
Тип |
Совместимость |
Примечание |
| Stable Diffusion 3 Medium |
Текст в изображение |
✅ |
Использует 8×Ascend 910B и большой объём HBM для генерации изображений вплоть до 4096×4096, а также дообучения и кастомизации SD3-сценариев под свои датасеты. |
| FLUX.2-dev |
Текст в изображение |
✅ |
Ускоренная версия FLUX для 4K-генерации; на Atlas 800T A2 хорошо масштабируется по 8 NPU и подходит как для офлайн-рендеринга, так и для продакшн-сервисов генерации. |
| Stable Video Diffusion 1.1 |
Видео(img2vid) |
✅ |
Использует Ascend 910B для генерации реалистичных роликов до ~8 секунд в Full HD; для более длинных видео рекомендуется рендер по сегментам и параллельный запуск нескольких задач на кластере Atlas 800T A2. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers |
Текст в изображение |
✅ |
Лёгкая версия Kandinsky 5.0 (~35 GB VRAM); на Atlas 800T A2 есть значительный запас HBM для высокого разрешения, крупных батчей и параллельного запуска нескольких генеративных пайплайнов. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers |
Текст в видео |
✅ |
T2V-модель (~29 GB VRAM) для роликов до ~5 секунд; на Atlas 800T A2 хорошо масштабируется по нескольким NPU и подходит для продакшн-пайплайнов генерации короткого видео и тизеров. |
Технические характеристики
| Видеокарта | 8x Ascend 910B 64GB HBM |
| Процессор | 4x Kunpeng 920 (64c/64t, 2.6Ghz, 180W)
|
| Оперативная память | 512GB DDR4 ECC REG возможно увеличить до 2TB |
| Сетевые карты | 8-port 200Gbe QSFP интерфейс прямого выхода, протокол RoCE |
Нажимая кнопку «Отправить», я даю согласие на обработку и хранение персональных данных и принимаю соглашение