浪潮信息 AI 服务器搭载 NVIDIA A100 Tensor Core GPU 在 MLPerf Training v2.0 全球 AI 基准测试中保持单节点性能第一

Admin 704 2022-07-29 16:31

成都浪潮服务器代理商_开放工程联盟 MLCommons 发布了最新的 MLPerf Training v2.0 结果,其中浪潮 AI 服务器在封闭分区单节点性能方面处于领先地位。

MLPerf 是全球最具影响力的 AI 性能基准。它由 MLCommons 管理,成员来自 50 多家全球领先的人工智能公司和顶级学术机构,包括浪潮信息、谷歌、Facebook、英伟达、英特尔、哈佛大学、斯坦福大学和加州大学伯克利分校。MLPerf AI Training benchmark每年举办两次,追踪计算性能的提升,为用户提供权威的数据指导。

成都浪潮服务器代理商_最新的MLPerf Training v2.0吸引了浪潮信息、谷歌、英伟达、百度、Intel-Habana、Graphcore等全球21家厂商和研究机构参与。共有 264 份提交,比上一轮增加了 50%。八项 AI 基准测试涵盖了当前主流使用的 AI 场景,包括 ResNet 图像分类、3D U-Net 医学图像分割、RetinaNet 轻量级物体检测、Mask R-CNN 重量级物体检测、RNN- 语音识别T,使用 BERT 进行自然语言处理,使用 DLRM 进行推荐,使用 MiniGo 进行强化学习。

成都浪潮服务器代理商_在单节点系统的封闭划分基准中,浪潮信息及其高端 AI 服务器在 BERT 自然语言处理、DLRM 推荐和 RNN-T 语音识别方面表现最佳。它在单节点系统提交者中获得了最多的冠军。在配备 8 块 NVIDIA A100 Tensor Core GPU 的主流高端 AI 服务器中,浪潮信息 AI 服务器在 BERT、DLRM、RNN-T、ResNet 和 Mask R-CNN 五个任务中排名第一。

AI计算性能持续领先

成都浪潮服务器代理商_浪潮AI服务器通过全面的软硬件优化,不断实现AI性能突破。与 2018 年 MLPerf v0.5 的结果相比,浪潮 AI 服务器在典型的 8-GPU 服务器模型中表现出高达 789% 的显着性能提升。

成都浪潮服务器代理商_浪潮AI服务器在MLPerf中的领先性能得益于其出色的设计创新和AI的全栈优化能力。针对AI训练密集I/O传输的瓶颈,浪潮AI服务器采用PCIe无重定时器设计,CPU和GPU之间实现高速互联,降低通信时延。针对高负载、多GPU协同任务调度,优化NUMA节点与GPU之间的数据传输,保证训练任务中的数据I/O处于最高性能状态。散热方面,浪潮信息率先部署8颗500W高端NVIDIA Tensor Core A100 GPU4U空间,支持风冷和液冷。同时,浪潮AI服务器不断优化预训练数据处理性能,采用超参数、NCCL参数等组合优化策略,以及英伟达AI软件栈提供的诸多增强,最大限度地提高AI模型训练性能。

大幅提升 Transformer 训练性能

基于 Transformer 神经网络架构的预训练海量模型引领了新一代 AI 算法的发展。MLPerf 基准测试中的 BERT 模型基于 Transformer 架构。Transformer 简洁且可堆叠的架构使得训练具有巨大参数的海量模型成为可能。这导致了大模型算法的巨大改进,但对人工智能系统的处理性能、通信互联、I/O性能、并行扩展、拓扑和散热提出了更高的要求。

成都浪潮服务器代理商_在BERT基准测试中,浪潮AI服务器通过优化数据预处理、提升NVIDIA GPU间密集参数通信、超参数自动优化等方法进一步提升BERT训练性能。浪潮信息AI服务器可完成约3.3亿个参数的BERT模型训练在短短 15.869 分钟内使用来自 Wikipedia 数据集的 2,850,176 条数据,与 Training v0.7 中 49.01 分钟的顶级性能相比,性能提升了 309%。至此,浪潮AI服务器连续第三次获得MLPerf Training BERT benchmark。

浪潮信息在MLPerf Training v2.0中得分最高的两台AI服务器分别是NF5488A5和NF5688M6。NF5488A5 是全球首批在 4U 空间内支持 8 个采用 NVIDIA NVLink 技术的 NVIDIA A100 Tensor Core GPU 和两个 AMD Milan CPU 的服务器之一。它支持液冷和风冷。它总共赢得了 40 个 MLPerf 冠军。NF5688M6 是一款可扩展的 AI 服务器,专为大规模数据中心优化而设计。它支持 8 个 NVIDIA A100 Tensor Core GPU 和 2 个 Intel Ice Lake CPU,最多支持 13 个 PCIe Gen4 IO,共获得 25 个 MLPerf 冠军。 


【公司名称】四川旭辉星创科技有限公司

【代理级别】成都浪潮Inspur服务器总代理

【销售经理】李经理

【联系方式】座机:028-85596747    手机:13540160369

【公司地址】成都市人民南路4段 桐梓林 商鼎国际2号楼1单元1913

联系我们
您好,咨询客服了解更多促销产品
售前优惠在线咨询
QQ咨询
微信咨询
售前优惠电话咨询专线:
13438344046
售后电话咨询专线:
028-85596747

请用微信扫描二维码

1.248484s