
Анализ
В настоящее время ключевыми драйверами спроса и развития систем хранения данных являются киберустойчивость и безопасность, с одной стороны, а также обучение и выводы ИИ — с другой.
На начало 2025 года ситуация с IT-системами хранения данных выглядит яркой и перспективной: на всех уровнях стека хранения ведутся активные разработки. Эти изменения обусловлены потребностью в увеличении объёма памяти, создании более ёмких твердотельных накопителей (SSD), разработке жёстких дисков с большей ёмкостью, улучшении обработки данных на графических процессорах (GPU) и подготовке инфраструктуры для анализа данных на основе искусственного интеллекта. Мы также наблюдаем улучшение защиты и безопасности данных, а объектное хранилище продолжает совершенствоваться, предлагая всё более производительный доступ для задач обучения и вывода ИИ.
Давайте немного отступим и попробуем понять, что на самом деле представляет собой IT-хранилище и для чего оно нужно. Ответ на второй вопрос проще: системы хранения данных существуют, чтобы обеспечивать приложения данными, необходимыми для их работы на серверах или других хостах, а также для хранения данных, которые эти приложения производят. Все, что использует хранимые данные, в данном контексте является приложением.
IT-хранилище можно представить как многоуровневую структуру (или стек), начиная с базовых типов носителей данных на нижнем уровне и заканчивая устройствами, которые объединяют носители в логические диски. Следующий уровень объединяет эти диски в пригодные для использования аппаратные системы, такие как SAN (сети хранения данных) и файловые серверы. Далее идёт программное обеспечение, которое управляет этими системами, и, наконец, верхний уровень — софт, представляющий хранилище как API или протокол для доступа приложений.
Эта структура включает SAN с блочным доступом к данным, файловые системы с доступом на уровне файлов и объектные хранилища. Приложениями, использующими эти системы, могут быть транзакционные или аналитические базы данных, которые представляют свое объектное хранилище по протоколу для ПО, вроде систем управления взаимоотношениями с клиентами (CRM) или аналитических приложений для выявления мошенничества на основе ИИ.
Данные в хранилищах делятся на три категории:
-
Первичные данные — используются непосредственно для работы баз данных.
-
Вторичные данные — копии, предназначенные для защиты от потерь или повреждения первичных данных.
-
Третичные (архивные) данные — используются для долгосрочного хранения справочной информации.
Мы можем представить все эти концепции в виде диаграммы уровней хранения:
В диаграмме есть два боковых блока: слева — блок бизнес-модели, а справа — резервное копирование и киберустойчивость. Эти элементы относятся к разным уровням стека хранения данных и не образуют единый слой.
Эту диаграмму можно использовать для общего, а не точного, размещения технологий и поставщиков в стеке. Это позволяет увидеть их взаимосвязь и то, как они развиваются с течением времени. Вот пример, иллюстрирующий некоторых поставщиков решений для управления данными:
Развитие технологий и поставщики
По мере продвижения вверх по стеку хранения количество новых поставщиков обычно увеличивается, как и их финансирование. На нижнем уровне поставщики NAND-памяти, дисков и ленточных носителей практически не изменились за последние несколько лет после консолидации отрасли. Например, среди поставщиков дисковых накопителей остались три компании: Seagate, Toshiba и Western Digital. Более 90 % DRAM выпускают Micron, Samsung и SK hynix, а Nanya и Winbond занимают нишевые позиции на рынке.
Тем не менее в области подключения DRAM заметна активность стартапов. Концепция подключаемой внешней памяти CXL (Compute Express Link) стимулировала развитие поставщиков аппаратного и программного обеспечения CXL, вроде Panmnesia и UniFabriX. Также ведутся разработки в области 3D DRAM, примером которых является стартап Neo Semiconductor.
Поставки NAND остаются относительно стабильными, хотя недавние изменения в отрасли привлекли внимание. Intel продала своё подразделение NAND под названием Solidigm компании SK hynix. Сегодня среди крупных игроков можно выделить Kioxia, Micron, Samsung, SK hynix/Solidigm, Western Digital и китайскую YMTC. Kioxia недавно провела первичное публичное размещение акций (IPO). В то же время Western Digital объявила о разделении бизнеса на два подразделения: производство жёстких дисков и NAND/SSD (SanDisk?). Вероятно и здесь может произойти консолидация поставщиков.
На уровне аппаратных массивов в период с 2000 по 2010 годы доминировали крупные игроки, использующие блочные и файловые протоколы, такие как Dell, Hitachi Vantara, HPE, IBM и NetApp. Однако в дальнейшем произошёл всплеск появления новых компаний: Pure Storage была основана в 2009 году, Infinidat — в 2010, StorONE — в 2011, а VAST Data — в 2016. После этого значимых стартапов в области систем хранения данных не появлялось.
Тем не менее архитектура DASE (Disaggregated, Shared-Everything) от VAST Data оказала заметное влияние на индустрию. Она вдохновила HPE на разработку новых решений, побудила NetApp начать проект по модернизации ONTAP и совпала с разработкой операционной системы Myriad Storage от Quantum.
Область корпоративных файловых систем хранения данных развивалась относительно слабо, в ней доминировали компании Dell и NetApp. Однако в 2012 году на этот рынок вышла компания Qumulo, в 2013 году — WEKA, а в 2016 году — VAST. На рынке параллельных файловых систем для HPC присутствуют такие лидеры, как DDN (Lustre), IBM с Storage Scale и Panasas, которая теперь переименована в VDURA. Здесь также находятся DAOS, BeeGFS и Quobyte от Intel.
В области контейнеров данных происходит бурное развитие, особенно в сфере аналитики, с переходом хранилищ данных и Hadoop эпохи больших данных в озера данных (data lake) и озёрные хранилища (lakehouses), которые включают всё больше неструктурированных данных.
Компания Snowflake была основана в 2012 году, росла стремительно и вышла на биржу в 2020 году. Компания Databricks была основана в 2013 году и так выросла, что привлекла невероятные 14 миллиардов долларов венчурного финансирования. Примерно 10 миллиардов из этой суммы было привлечено в прошлом году, что, безусловно, является рекордом по объёму финансирования стартапов в сфере хранения данных и создаёт значительное давление на любое будущее IPO Databricks.
Бум больших языковых моделей GenAI стимулирует стремительный рост в этой области, что приводит к появлению специализированных поставщиков векторных баз данных, таких как Pinecone, основанной в 2019 году, и Milvus, созданной Zilliz в 2017 году. Существующие игроки, занимающиеся консолидацией типов данных, такие как SingleStore, стремятся не отставать.
Где можно разместить CTERA, Egnyte, Nasuni и Panzura? Эти компании можно отнести к слою протоколов, в категории Cloud-to-edge, поскольку они предоставляют средства для совместной работы. Panzura переходит в область управления данными после покупки Moonwalk и разработки решения Symphony. Компания Nasuni, большая часть бизнеса которой теперь принадлежит частному капиталу, активно развивает ИИ, так же как и CTERA.
Где расположить поставщиков вычислительных систем хранения данных? Есть как вычислительные диски — например, ScaleFlux, так и вычислительные системы хранения, например контроллеры массивов хранения, работающие с программным обеспечением для контейнерных приложений, с которыми связаны VAST Data и Dell.
Где на диаграмме находятся DPU и SmartNIC? В слое Hardware Type есть категория DPU-assisted, которая располагается второй снизу. В своё время существовала отдельная группа поставщиков DPU-стартапов — например, Pensando и Fungible, но все они были поглощены, и теперь в этой области доминируют крупные поставщики, такие как Amazon, AMD (Pensando), Intel, Microsoft с Azure (Fungible) и Nvidia с продуктами BlueField.
DataCore, получающая инвестиции в разработку ИИ, находится в слое StorageOS, наряду с StorPool и Ceph от Red Hat.
Где расположены Dell PowerProtect, ExaGrid, ObjectFirst, Quantum DXi и HPE StoreOnce? Все эти компании предлагают специализированные массивы, которые обеспечивают функциональность целевых устройств для резервного копирования.
Киберустойчивость и SaaS серьёзно меняют рынок резервного копирования. Лидерами здесь являются Cohesity, Commvault, Dell, Rubrik и Veeam, а также стремительно развивающиеся компании, такие как Druva, HYCU, KeepIt и другие.
Ожидается, что к 2025 году влияние технологий CXL возрастёт, однако основными драйверами рынка хранения данных останутся ИИ и киберустойчивость.
Источник