浪潮人工智能服务器在最新的 MLPerf ™ Training v1.0 基准测试中展现领先性能

Admin 856 2021-11-15 13:55

最近发布了该组织的机器学习培训性能基准套件 MLPerf Training v1.0 的新结果。浪潮在 MLPerfTraining v1.0 的封闭部门的八项任务中的四项中位居单节点性能榜首。 

浪潮单节点性能结果

MLPerf™ 培训 v1.0

公司

任务

模型

结果(分钟)

浪潮

图像分类

网络

27.38

自然语言处理

伯特

21.15

物体检测

固态硬盘

8.31

推荐

DLRM

1.91

MLPerf™ 是 AI 性能的领先行业基准,于 2018 年开发。浪潮是 MLCommons™ 的创始成员,与来自人工智能领域的其他 50 多家领先组织和公司一起。MLPerf™ Training v1.0 测量在各种任务中将机器学习模型训练到标准质量目标所需的时间,包括图像分类 (ResNet)、图像分割 (U-Net3D)、对象检测(轻量级、SSD)、对象检测(重量级,Mask R-CNN)、语音识别(RNN-T)、NLP(BERT)、推荐(DLRM)和强化学习(MiniGo),每个都有封闭和开放的性能划分。

浪潮在Closed部门的图像分类(ResNet)、NLP(BERT)、对象检测(SSD)和推荐(DLRM)训练任务中排名第一,浪潮NF5688M6在ResNet、DLRM和SSD中实现单节点性能最佳和 BERT 中的 NF5488A5。

凭借其对软件和硬件的优化能力,浪潮显着提高了 MLPerf™ 训练基准的单节点性能。与2020年MLPerf™ Training v0.7基准测试的表现相比,浪潮在图像分类、NLP、目标检测和推荐的单节点性能上创造了记录,每个模型的训练时间分别缩短了17.95%、56.85% 、18.61% 和 42.64%,清楚地展示了使用顶级 AI 服务器提高 AI 模型训练效率的价值。

浪潮在 MLPerf™ 基准测试中的成功在于系统设计和全栈优化的优势,作为人工智能计算系统创新的一部分。硬件方面,浪潮对NUMA节点与GPU之间的数据传输进行了全面优化和深度校准,确保训练时I/O无阻塞。此外,浪潮还为A100 GPU开发了先进的500W TDP(业界最高功率)的液冷板式冷却系统,以确保GPU可以满负荷正常运行,从而显着提高AI计算的性能系统。

浪潮秉承 MLCommons™ 的理念,将基准中探索的优化解决方案贡献给社区,以加速机器学习创新和人工智能技术。

在 2020 年 MLPerf™ Training v0.7 基准测试中,浪潮进行了优化,以提升 ResNet 的收敛性:在 ImageNet 上,该解决方案仅用 85% 的迭代就达到了 75.9% 的目标准确率,将训练效率提高了 15%。此后,该优化被社区成员采用并广泛用于 MLPerf™ Training v1.0 基准测试——这是今年 ResNet 显着改进的重要原因。

自 2020 年以来,浪潮参加了四项 MLPerf™ 基准测试——training v0.7、Inference v0.7、Inference v1.0 和 training v1.0。在今年的MLPerf™ Inference v1.0中,浪潮在数据中心封闭部门创造了11项记录,在边缘封闭部门创造了7项记录,成为排名最高的公司。

作为领先的人工智能计算公司,浪潮致力于人工智能计算、资源化和算法平台的研发和创新。它还与其他领先的人工智能企业合作,通过其“元大脑”技术生态系统推动人工智能产业化和人工智能驱动产业的发展。

【公司名称】四川旭辉星创科技有限公司

【代理级别】成都浪潮Inspur服务器总代理

【销售经理】李经理

【联系方式】座机:028-85596747    手机:13540160369

【公司地址】成都市人民南路4段 桐梓林 商鼎国际2号楼1单元1913

联系我们
您好,咨询客服了解更多促销产品
售前优惠在线咨询
QQ咨询
微信咨询
售前优惠电话咨询专线:
13438344046
售后电话咨询专线:
028-85596747

请用微信扫描二维码

0.868620s