Зі швидким розвитком додатків штучного інтелекту, на чолі з такими моделями, як ChatGPT, попит на обчислювальну потужність різко зріс. Щоб задовольнити зростаючі обчислювальні вимоги епохи штучного інтелекту, H3C Group під егідою Tsinghua Unigroup нещодавно представила 11 нових продуктів із серії H3C UniServer G6 і HPE Gen11 на саміті NAVIGATE Leader Summit 2023. Ці нові серверні продукти створюють комплексну матрицю для штучного інтелекту в різних сценаріях, забезпечуючи потужну базову платформу для обробки масивних даних і алгоритмів моделей, а також забезпечуючи достатній запас обчислювальних ресурсів ШІ.
Різноманітна матриця продуктів для задоволення різноманітних обчислювальних потреб ШІ
Будучи лідером у сфері інтелектуальних обчислень, H3C Group активно працює у сфері ШІ протягом багатьох років. У 2022 році компанія H3C досягла найвищих темпів зростання на китайському ринку прискорених обчислень і зайняла загалом 132 перших місця у світовому рейтингу у всесвітньо відомому бенчмарку штучного інтелекту MLPerf, демонструючи свій потужний технічний досвід і можливості.
Використовуючи вдосконалену обчислювальну архітектуру та можливості інтелектуального керування обчислювальною потужністю, побудовані на основі інтелектуальних обчислень, H3C розробила флагман інтелектуальних обчислень H3C UniServer R5500 G6, спеціально розроблений для навчання великомасштабних моделей. Вони також представили H3C UniServer R5300 G6, гібридний обчислювальний механізм, який підходить для масштабних сценаріїв висновків/навчання. Ці продукти також відповідають різноманітним вимогам до обчислень у різних сценаріях ШІ, забезпечуючи повне покриття обчислень ШІ.
Флагман інтелектуальних обчислень, створений для навчання великомасштабних моделей
H3C UniServer R5500 G6 поєднує в собі потужність, низьке енергоспоживання та інтелект. Порівняно з попереднім поколінням, він пропонує втричі більшу обчислювальну потужність, скорочуючи час навчання на 70% для сценаріїв навчання великомасштабної моделі GPT-4. Він застосовний до різних бізнес-сценаріїв ШІ, таких як масштабне навчання, розпізнавання мови, класифікація зображень і машинний переклад.
Потужність: R5500 G6 підтримує до 96 ядер ЦП, забезпечуючи збільшення продуктивності ядра на 150%. Він оснащений новим 8-графічним модулем NVIDIA HGX H800, який забезпечує обчислювальну потужність 32 PFLOPS, що забезпечує 9-кратне підвищення швидкості навчання ШІ великомасштабної моделі та 30-кратне підвищення продуктивності ШІ-виведення великомасштабної моделі. Крім того, завдяки підтримці мереж PCIe 5.0 і 400G користувачі можуть розгортати високопродуктивні обчислювальні кластери ШІ, прискорюючи впровадження та застосування ШІ на підприємствах.
Інтелект: R5500 G6 підтримує дві конфігурації топології, інтелектуально адаптуючись до різних сценаріїв застосування штучного інтелекту та прискорюючи глибоке навчання та наукові обчислювальні програми, значно покращуючи використання ресурсів GPU. Завдяки функції мультиінстанційного GPU модуля H800 один H800 можна розділити на 7 екземплярів GPU з можливістю створення до 56 екземплярів GPU, кожен з яких має незалежні обчислювальні ресурси та ресурси пам’яті. Це значно підвищує гнучкість ресурсів ШІ.
Низький викид вуглецю: R5500 G6 повністю підтримує рідинне охолодження, включаючи рідинне охолодження як ЦП, так і ГП. Завдяки PUE (ефективності енергоспоживання) нижче 1,1 він забезпечує «круті обчислення» в розпал обчислювального сплеску.
Варто зазначити, що після випуску R5500 G6 був визнаний одним із «10 найкращих високопродуктивних серверів 2023 року» в рейтингу потужності обчислювальної продуктивності 2023 року.
Гібридний обчислювальний механізм для гнучкого узгодження вимог щодо навчання та висновків
H3C UniServer R5300 G6, як сервер зі штучним інтелектом наступного покоління, пропонує значні покращення в характеристиках ЦП і ГП порівняно зі своїм попередником. Він може похвалитися видатною продуктивністю, інтелектуальною топологією та інтегрованими обчислювальними можливостями та можливостями зберігання, що робить його придатним для навчання моделям глибокого навчання, логічного висновку та інших сценаріїв додатків штучного інтелекту, гнучко відповідаючи потребам у обчисленні навчання та висновків.
Неперевершена продуктивність: R5300 G6 сумісний з останнім поколінням графічних процесорів NVIDIA корпоративного класу, забезпечуючи підвищення продуктивності в 4,85 раза порівняно з попереднім поколінням. Він підтримує різні типи карт прискорення штучного інтелекту, наприклад GPU, DPU та NPU, щоб задовольнити різноманітні вимоги до обчислювальної потужності штучного інтелекту в різних сценаріях, розширюючи можливості ери інтелекту.
Інтелектуальна топологія: R5300 G6 пропонує п'ять налаштувань топології GPU, включаючи HPC, паралельний штучний інтелект, послідовний штучний інтелект, прямий доступ до 4 карт і прямий доступ до 8 карт. Ця безпрецедентна гнучкість значно підвищує адаптивність до різних сценаріїв додатків користувача, розумно розподіляє ресурси та забезпечує ефективну роботу обчислювальної потужності.
Інтегровані обчислення та зберігання: R5300 G6 гнучко підтримує карти прискорення AI та інтелектуальні мережеві карти, поєднуючи можливості навчання та висновків. Він підтримує до 10 графічних процесорів подвійної ширини та 24 слоти для жорстких дисків LFF (великого форм-фактора), забезпечуючи одночасне навчання та висновки на одному сервері та забезпечуючи економічно ефективний обчислювальний механізм для середовищ розробки та тестування. Завдяки ємності до 400 ТБ він повністю відповідає вимогам до місця для зберігання даних AI.
У зв’язку зі стрімким розвитком штучного інтелекту обчислювальна потужність постійно змінюється та зазнає викликів. Випуск наступного покоління серверів зі штучним інтелектом знаменує собою ще одну віху в прихильності H3C Group технології «внутрішнього інтелекту» та її постійному прагненні до еволюції інтелектуальних обчислень.
Дивлячись у майбутнє, керуючись стратегією «Cloud-Native Intelligence», H3C Group дотримується концепції «ретельного прагматизму, наділяючи епоху інтелектом». Вони продовжуватимуть обробляти родючий ґрунт інтелектуальних обчислень, досліджувати сценарії застосування ШІ глибокого рівня та прискорювати появу розумного світу з адаптованою обчислювальною потужністю, готовою до майбутнього.
Час публікації: 04 липня 2023 р