Мини компьютер рассчитан на Инференс / Развертывание (Inference) локальных LLM и ассистентов, RAG-системы (Retrieval-Augmented Generation) для работы с базами знаний, а также Анализ данных (Data Science) и Визуализация и рендеринг в компактном форм-факторе.
В основе - AMD Ryzen™ AI Max+ 395 (16C/32T, Turbo до 5.1 GHz) и встроенная графика AMD Radeon 8060S. Плюс отдельный AI-блок AMD Ryzen™ AI с производительностью до 50 TOPS на NPU и до 126 TOPS суммарно - это полезно для локальных AI-пайплайнов и ускорения задач через совместимые фреймворки (например, ONNX Runtime).
Важно учитывать ограничение интегрированной графики - у неё нет выделенной VRAM как у дискретных GPU, используется общая память LPDDR5x. Это означает гибкость по объёму, но производительность и совместимость ускорения зависят от ОС, драйверов и выбранного бэкенда (Windows чаще ONNX DirectML, Linux - варианты с HIP/ROCm если поддерживается конкретной конфигурацией).
Что может быть в конфигурации: процессор AMD Ryzen AI Max+ 395 на 16 ядер и 32 потока с Turbo до 5.1 GHz, встроенная графика AMD Radeon 8060S и AI-движок AMD Ryzen AI с производительностью до 50 TOPS на NPU и до 126 TOPS суммарно. Оперативная память LPDDR5x-8000 MHz - до 128 GB. Для хранения данных предусмотрены два слота M.2 2280 NVMe с поддержкой до 8 TB на каждый,один работает по PCIe 4.0 x4, второй по PCIe 4.0 x1. Из коммуникаций доступны WiFi 7 и Bluetooth 5.4, а для проводной сети - два порта 10GbE LAN (RJ45) на контроллерах Realtek RTL8127. Для вывода изображения есть HDMI 2.1 FRL и USB4 с Alt DP 2.0, оба поддерживают до 8K@60Hz или 4K@120Hz. По интерфейсам имеются USB 3.2 Gen2 10 Gbps, USB 2.0, USB4 40 Gbps и USB4 v2 80 Gbps с Alt DP2.0 и PD out 15W, а звук выводится через HDMI или 3.5mm combo jack (TRRS) плюс предусмотрены 2 DMIC. Внутри есть слот PCIe x16 с подключением PCIe 4.0 x4, поддерживается крепление VESA 100 - 178.5 mm, питание рассчитано на AC 100-240V с максимальной мощностью до 320W, система - Windows 11 Pro.
Производительность
| Категория | Мощность |
| Overall | 126 TOPS |
| NPU | 50 TOPS |
Совместимость с LLM-моделями
| Модель |
Тип квантизации |
Требуется VRAM |
Совместимость |
Примечание |
| Qwen3-30B-A3B-Thinking-2507 |
Нет |
Примерно 61.1GB |
✅ |
Крупная MoE-модель под сложный reasoning и RAG. На MINISFORUM MS-S1 MAX с 128GB LPDDR5x unified memory помещается по памяти при условии выделения достаточного объёма под графику. Для стабильной работы лучше использовать оптимизированные рантаймы и квантованные сборки когда доступны, а также держать разумный контекст чтобы оставить запас под KV-кэш и параллельные запросы. |
| DeepSeek-R1-Distill-Qwen-32B |
Нет |
Примерно 65.5 |
✅ |
Дистиллированная R1 на базе Qwen 32B - сильна в рассуждениях и коде при умеренных требованиях к ресурсам. На MINISFORUM MS-S1 MAX её удобно использовать как ядро локального чат-бота, агентных сценариев и RAG-сервисов. Для более отзывчивой работы обычно выбирают Q4-версии или частичный CPU-offload, особенно если нужен длинный контекст. |
| gpt-oss-120b-GGUF |
Q4_K_M |
Примерно 62.8GB |
✅ |
Большая 120B модель в GGUF под запуск через llama.cpp или совместимые движки. В Q4 помещается в 128GB unified memory, но скорость будет сильно зависеть от выбранного бэкенда и настроек. Рост контекста заметно увеличивает расход на KV-кэш, поэтому для комфортной работы лучше ограничивать контекст и настраивать потоковый вывод. |
| GLM-4.7-Flash |
Нет |
Примерно 62.5GB |
✅ |
Быстрая версия GLM для диалогов, суммаризации и RAG-сценариев с низкой задержкой. На MINISFORUM MS-S1 MAX по памяти проходит, при этом лучший опыт обычно даёт квантованная сборка и аккуратная настройка контекста и батча под интегрированную графику. |
| Gemma-4-31B-it |
Нет |
Примерно 62.6GB |
✅ |
Хороший вариант для локальной работы - модель помещается с запасом под контекст и стабильный запуск на каждый день. |
Совместимость с диффузионными моделями
| Модель |
Тип |
Совместимость |
Примечание |
| Stable Diffusion 3 Medium (SD3-M) |
Текст в изображение |
✅ |
Актуальная SD-модель с улучшенным следованием промпту и цветом. На MINISFORUM MS-S1 MAX возможна генерация в высоком качестве, но на встроенной Radeon 8060S быстрее работают умеренные разрешения и батчи. При росте разрешения нагрузка и время рендера заметно увеличиваются, поэтому лучше подбирать параметры под реальную скорость. |
| FLUX.2-klein-9B |
Текст в изображение |
✅ |
Ускоренная модель для быстрого inference и прототипирования. На MINISFORUM MS-S1 MAX удобнее запускать через пайплайны с оптимизациями, например ComfyUI, а также сборки с ONNX где это доступно. Итоговая скорость зависит от драйверов и выбранного бэкенда для AMD. |
| Stable Video Diffusion 1.1 (SVD 1.1) |
Видео (img2vid) |
✅ |
Генерация коротких роликов из изображения. Unified memory 128GB помогает держать буферы и последовательности кадров без частых упоров в память, но производительность ограничивается вычислениями iGPU. На практике комфортнее короткие клипы и умеренное разрешение. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers |
Текст в изображение |
✅ |
Лёгкая версия Kandinsky с относительно умеренными требованиями по памяти. На MINISFORUM MS-S1 MAX остаётся запас под повышенное разрешение, CFG и дополнительные узлы в пайплайне, особенно если не гнаться за большими батчами. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers |
Текст в видео |
✅ |
T2V-модель для коротких роликов. На MINISFORUM MS-S1 MAX удобно собирать многостадийные пайплайны с кэшами и буферами в пределах 128GB unified memory, а для стабильной скорости лучше держать длину ролика и разрешение в разумных пределах. |
Нажимая кнопку «Отправить», я даю согласие на обработку и хранение персональных данных и принимаю соглашение