
Компания Kioxia объявила о работе над твердотельным накопителем, способным выполнять до 100 миллионов случайных операций IOPS. Проект реализуется совместно с NVIDIA, и по данным источников, NVIDIA намерена использовать два таких SSD (что в сумме даст колоссальные 200 миллионов IOPS) в своих ИИ-системах, подключая их напрямую к своим графическим процессорам. Давайте подробнее разберем, насколько амбициозную задачу поставили перед собой компании, и какие технологии способны помочь в создании такого производительного SSD.
Накопитель на 100 миллионов IOPS
Ожидается, что накопители Kioxia со скоростью случайного чтения в 100 миллионов IOPS будут использовать интерфейс PCIe 7.0 для прямого подключения к GPU в режиме peer-to-peer. Они создаются специально для ИИ-серверов, которым требуется мгновенный доступ и обработка огромных массивов данных. Современные топовые SSD выдают около 3 миллионов случайных операций ввода-вывода (4K IOPS). Однако, чтобы угнаться за производительностью нынешних и будущих GPU, накопителям недостаточно просто стать быстрее — нужны принципиально новые подходы к взаимодействию с NAND-памятью.
Ещё в начале года генеральный директор Silicon Motion Уоллес Коу упоминал, что NVIDIA заинтересована в создании SSD с производительностью до 100 миллионов случайных IOPS — что в 33 раза превышает возможности современных накопителей. Тогда же Kioxia анонсировала планы по выпуску ИИ-накопителей на базе XL-Flash с производительностью свыше 10 миллионов операций случайного чтения (512K IOPS) во второй половине 2026 года.
ИИ-задачи требуют постоянных обращений к памяти для чтения небольших случайных фрагментов данных — параметров моделей или записей баз данных. В таких задачах 512-байтовые блоки данных точнее соответствуют реальным рабочим нагрузкам, чем традиционные 4КБ блоки, и обеспечивают меньшую задержку. Хотя работа с 512-байтовыми блоками может ограничивать пиковую пропускную способность по сравнению с обычными SSD (где используются 4КБ блоки), нарастить скорость последовательного чтения/записи с помощью массива накопителей проще, чем снизить задержки у классических SSD.
Пока остаётся под вопросом, удастся ли Kioxia в 2026 году выпустить ИИ-накопитель на 10 миллионов операций чтения, если уже в 2027 году компания планирует представить модель на 100 миллионов случайных IOPS.
Источник изображений: Kioxia
Всё получится благодаря XL-Flash?
Особый интерес вызывает то, как именно Kioxia намерена достичь заявленных показателей. Разрабатываемый ею ИИ-SSD использует память XL-Flash — это SLC NAND с повышенной устойчивостью к износу, крайне низкой задержкой и высокой производительностью. Чипы XL-Flash от Kioxia используют 16 плоскостей (planes) — значительно больше, чем 3–6 плоскостей в современных 3D NAND-чипах для потребительских ПК — что теоретически позволяет добиться высоких скоростей как последовательного, так и случайного доступа. Поскольку Kioxia не раскрывает детальные спецификации XL-Flash, судить о реальной производительности этого типа памяти на уровне отдельного чипа сложно.
Для ориентира: SSD объёмом 400 ГБ на контроллере Innogrit Tacoma с памятью XL-Flash (32 кристалла NAND, из которых 7 отведены под резерв) и интерфейсом PCIe 5.0 x4 демонстрирует производительность в 3,5 миллиона случайных операций чтения (IOPS) и 0,5 миллиона операций записи в секунду. Примерные расчёты показывают, что каждый кристалл вносит до 109 375 операций случайного чтения и 15 625 операций записи в секунду — впрочем, эти цифры носят оценочный характер.
При условии идеального линейного масштабирования с ростом числа NAND-устройств, для достижения 100 миллионов операций ввода-вывода потребовалось бы около 915 таких кристаллов (при том же уровне резервирования). Kioxia уже умеет размещать 32 кристалла NAND в одном корпусе, так что теоретически она могла бы создать накопитель на 915 чипов XL-Flash (в 28 корпусах). Такому накопителю потребовался бы специализированный контроллер с интерфейсом не менее PCIe 5.0 x16 (а в идеале — PCIe 7.0 x4). Однако на практике идеального масштабирования не бывает: реальная производительность NAND-устройств в SSD ограничена пропускной способностью каналов, архитектурными ограничениями, задержками команд, очередями, прошивкой и множеством других факторов. Поэтому более реалистичный вариант для SSD на 100 миллионов IOPS с памятью XL-Flash — это модуль с несколькими контроллерами и коммутатором. Подобное решение типично скорее для all-flash массивов, но Kioxia чётко заявляет именно о едином SSD-накопителе.
Ещё один кандидат — технология HBF
Поскольку использование традиционной 3D NAND для накопителя на 100 миллионов IOPS с блоками по 512B практически невозможно, а применение совершенно новой технологии памяти в коммерческом продукте для дата-центров маловероятно, Kioxia может обратиться к перспективным разработкам, которые используют NAND необычным образом.
Одна из таких технологий — high bandwidth flash (HBF), которая объединяет до 16 чипов NAND и логический кристалл (вероятно, речь о контроллере) в единый стек, соединяя их с помощью TSV-контактов и микровыводов (microbumps). Слои HBF используют проверенные ячейки памяти NAND, но при этом они организованы в несколько массивов для достижения максимального уровня параллелизма и, как следствие, производительности. Планирует ли Kioxia использовать именно HBF для этого проекта, или остановится на другом похожем решении — прямо сейчас неизвестно. Однако можно предположить, что компания намерена использовать наработки, полученные в ходе экспериментов с HBF при создании сверхпроизводительных SSD.
Нажимая кнопку «Отправить», я даю согласие на обработку и хранение персональных данных и принимаю соглашение