Supermicro расширил стоечные решения для ИИ и ГП с поддержкой AMD Instinct MI300

Аморфный Постер

Supermicro, Inc., производитель полных ИТ-решений для ИИ, облака, хранения данных и 5G/Edge, объявил о трех новых дополнениях к поколению серверов ГП H13 на базе AMD, оптимизированных для наилучшей производительности и эффективности, с использованием новых ускорителей серии AMD Instinct MI300. Мощные масштабируемые стоечные решения Supermicro с серверами с 8 ГП и конфигурацией AMD Instinct MI300X OAM идеально подойдут для обучения больших моделей.

Новые сервера 2U с жидкостным охлаждением и 4U с воздушным охлаждением с ускорителями на базе ускоренных процессоров AMD Instinct MI300A повышают эффективность центров обработки данных, а также обеспечивают быстрорастущие сложные потребности в ИИ, БЯМ и высокопроизводительных вычислениях. Новые системы содержат четыре ускоренных процессора для масштабируемых применений. Supermicro может предоставить готовые стойки с жидкостным охлаждением для масштабных сред мощностью до 1728 Тфлоп FP64 на стойку. Производственные мощности Supermicro по всему миру оптимизируют доставку этих новых серверов для конвергенции ИИ и высокопроизводительных вычислений.

«Мы с радостью расширяем наши полные стоечные ИТ-решения для обучения ИИ новейшим поколением ускорителей AMD Instinct с повышением производительности в 3,4 раза по сравнению с предыдущими поколениями, — сказал Чарльз Лян (Charles Liang), президент и генеральный директор Supermicro — Благодаря нашей способности предоставлять 4000 стоек с жидкостным охлаждением в месяц с наших производственных объектов по всему миру мы можем отправлять новейшие ГП-решения H13 с ускорителем AMD Instinct MI300X или ускоренным процессором AMD Instinct MI300A. Наша надежная архитектура обеспечивает работу сети 1:1 400G, выделенную для каждого ГП, предназначенного для масштабного ИИ и суперкомпьютерных кластеров с полностью интегрированными решениями с жидкостным охлаждением, предоставляя клиентам конкурентное преимущество благодаря производительности и высочайшей эффективности с простым развертыванием».

Система AS –8125GS-TNMR2, оптимизированная для БЯЛ, построена на базе архитектуры компоновочных блоков Supermicro, надежной конструкции для высокопроизводительных систем ИИ с масштабируемыми стойками с воздушным и жидкостным охлаждением. Сбалансированный дизайн системы связывает ГП с сетью 1:1 для предоставления большого пула памяти с высокой пропускной способностью в узлах и стойках для соответствия современным самым большим языковым моделям с триллионами параметров, что увеличивает параллельные вычисления и сокращает время обучения и задержку вывода. Система 8U с ускорителем MI300X OAM предлагает мощность ускорения 8 ГП с AMD Infinity Fabric™ Links, что обеспечивает пропускную способность входа/выхода P2P с теоретическим пиком 896 ГБ/с на платформе с открытым стандартом с лучшей в отрасли скоростью памяти ГП HBM3 в 1,5 ТБ в одной системе, а также поддержкой собственной разреженной матрицы, что способствует экономии энергии, снижению числа циклов вычислений и сокращению использования памяти для рабочих нагрузок ИИ. Каждый сервер оснащен двойными процессорами серии AMD EPYC™ 9004 с количеством ядер до 256. В масштабируемой стойке доступно 1000 ядер ЦП, 24 ТБ памяти DDR5, 6,144 ТБ памяти HBM3 и 9728 вычислительных блоков для самых сложных сред ИИ. Использование модуля OCP Accelerator Module (OAM), с которым у Supermicro имеется большой опыт в конфигурациях 8U, выводит на рынок полностью сконфигурированный сервер, который является более быстрым, чем индивидуальная сборка, который экономит средства и сокращает время.

Supermicro также представляет сервер 2U с жидкостным охлаждением и оптимальной плотностью, AS –2145GH-TNMR, и сервер 4U с воздушным охлаждением, AS –4145GH-TNMR, каждый из которых имеет 4 ускорителя AMD Instinct™ MI300A. Новые серверы предназначены для высокопроизводительных вычислений и ИИ, что требует крайне высокой коммуникации ЦП и ГП. Ускоренный процессор устраняет избыточные копии памяти, объединяя высокопроизводительные ЦП, ГП и память HBM3 на едином чипе. Каждый сервер содержит флагманские ядра ЦП x86 Zen4 для масштабирования. Кроме того, каждый сервер имеет 512 ГБ памяти HBM3. В полном стоечном решении (48U), состоящем из 21 системы 2U, доступно более 10 ТБ памяти HBM3, а также 19 152 вычислительных блока. Пропускная способность памяти от HBM3 к ЦП составляет 5,3 ТБ в секунду.

Обе системы оснащены двойными AIOM с поддержкой 400G Ethernet и расширенными сетевыми возможностями, предназначенными для улучшения пространства, масштабируемости и эффективности для высокопроизводительных вычислений. Система с прямым жидкостным охлаждением 2U обеспечивает отличную совокупную стоимость владения с экономией энергопотребления более 35% на основе 21 системного стоечного решения 2U с потреблением 61 780 ватт вместо 95 256 ватт у стойки с воздушным охлаждением, а также с 70% снижением количества вентиляторов по сравнению с системой с воздушным охлаждением.

«Ускорители серии AMD Instinct MI300 обеспечивают флагманскую производительность для долгосрочных ускоренных высокопроизводительных вычислений и для стремительно возрастающего спроса на генеративный ИИ, — сказал Форрест Норрод (Forrest Norrod), исполнительный вице-президент и генеральный директор Data Center Solutions Business Group, AMD. — Мы продолжаем тесно сотрудничать с Supermicro, выводя на рынок современные полные приложения для ИИ и высокопроизводительных вычислений на основе ускорителей серии MI300 и используя опыт Supermicro в проектировании систем и центров обработки данных».