
На конференции Google Cloud Next 25 компания Google анонсировала Ironwood — Tensor Processing Unit (TPU) седьмого поколения, созданный специально для инференса (вывода моделей ИИ). Это самый мощный и масштабируемый AI-ускоритель Google на сегодня, обеспечивающий беспрецедентную производительность и энергоэффективность.
От реактивного ИИ к проактивному
TPU от Google уже более десяти лет используются для обучения и обслуживания сложных моделей ИИ — как внутри компании, так и в Google Cloud. Но по словам представителей компании, Ironwood — это не просто развитие продукта TPU, а полноценная смена парадигмы.
Современный ИИ переходит от реактивных моделей (которые просто выдают информацию) к проактивным системам, способным самостоятельно анализировать данные, генерировать инсайты и принимать решения. Google называет это «эпохой инференса» — когда ИИ не просто обрабатывает запросы, а предугадывает потребности и предлагает решения.
Масштаб и производительность Ironwood
Ironwood — это революция в аппаратном обеспечении для ИИ:
-
Масштабируется до 9 216 чипов с жидкостным охлаждением.
-
Общая производительность такого кластера — 42,5 экзафлопс (в 24 раза больше, чем у самого мощного суперкомпьютера El Capitan, о котором вы наверняка слышали). Сравнение с максимальной производительностью у предыдущих поколении TPU представлена ниже:
-
Каждый чип обеспечивает 4 614 TFLOPS и оснащен 192 ГБ HBM-памяти (в 6 раз больше, чем у TPU шестого поколения Trillium).
-
Улучшенная межчиповая сеть (ICI) с пропускной способностью 1,2 Тбит/с (в 1,5 раза быстрее TPU v6 Trillium).
Этот уровень мощности позволяет запускать сверхбольшие LLM и MoE-модели, включая Gemini 2.5 и AlphaFold, с минимальными задержками.
Энергоэффективность
Одна из ключевых проблем современных ИИ-систем — огромное энергопотребление. Ironwood решает её за счёт:
-
2-кратного улучшения производительности на ватт по сравнению с Trillium (TPU v6).
-
Жидкостного охлаждения, позволяющего удвоить эффективность по сравнению с воздушным.
-
30-кратного превосходства в энергоэффективности над первым облачным TPU, выпущенном семь лет назад, в 2018 году.
В нашем распоряжении также есть диаграмма, которая демонстрирует значение TDP в сравнении с предыдущими модели ИИ-процессоров Google:
Дополнительные функции Ironwood
Ironwood также включает усовершенствованный SparseCore — специализированный ускоритель для обработки сверхбольших эмбеддингов, характерных для сложных задач ранжирования и рекомендаций. Расширенная поддержка SparseCore в Ironwood позволяет ускорять более широкий спектр рабочих нагрузок, выходя за рамки традиционных задач ИИ в финансовую и научную сферы.
Pathways, собственный ML-рантайм от Google DeepMind, обеспечивает эффективные распределенные вычисления на множестве чипов TPU. Pathways в Google Cloud упрощает масштабирование за пределы одного кластера Ironwood, позволяя объединять сотни тысяч чипов Ironwood для стремительного развития возможностей генеративного ИИ.
Заключение
Ironwood — это не просто новый процессор, а фундамент для следующего поколения ИИ. С его помощью Google Cloud позволит разработчикам и компаниям создавать более умные, автономные и масштабируемые AI-системы.
Ожидается, что Ironwood станет доступен уже в этом году. И если текущие модели вроде ранее упомянутых Gemini и AlphaFold уже меняют мир, то с Ironwood можно ожидать ещё более масштабных прорывов в области искусственного интеллекта.