戴尔科技、浪潮和 Supermicro 借助 Nvidia IA 将 AI 培训提升到一个新的水平

Admin 780 2021-12-08 11:47

戴尔科技浪潮和美超微首次在 MLPerf – Azure 基准测试中使用英伟达的人工智能服务器 (AI),创造了快速训练 AI 模型的新速度记录。此外,该公司的平台在 MLPerf 1.1 培训结果中为所有八种流行工作负载创下了记录。


Nvidia A100 Tensor Core GPU 提供了每个芯片标准化的最佳性能。他们与公司的 Nvidia InfiniBand 网络和软件堆栈进行了扩展,以提供最快的时间在 Selene 上进行训练,Selene 是一种基于模块化 Nvidia DGX SuperPOD 的内部 AI 超级计算机。


“我们再次为 MLPerf 的结果感到自豪。我们 Nvidia 很自豪能够为多家公司的加速发展做出贡献,我们在每次调查中总是超出我们的预期”,Nvidia 拉丁美洲企业部门主管 Marcio Aguiar 表示祝贺。


登顶根据最新结果,在训练 AI 模型时,Azure NDm A100 v4 实例速度很快。它运行了最后一轮的所有测试,并将其扩展到 2,048 个 A100 GPU。


Azure 不仅表现出出色的性能,而且表现出如今可供任何人在美国六个地区租用和使用的性能。


人工智能培训是一项需要付出很多努力的大工程。为此,英伟达希望用户使用他们选择的服务或系统以创纪录的速度训练模型。


通过这种方式,该公司正在为 Nvidia AI 提供面向云服务、主机托管服务、企业和科学计算中心的产品。


服务器厂商

大显身手 在OEM厂商中,浪潮凭借其液冷NF5688M6和NF5488A5八路GPU系统,创下了单节点性能最高记录。戴尔和 Supermicro 在四路 A100 GPU 系统中创造了记录。


本轮共有 10 家 Nvidia 合作伙伴、8 家 OEM 和两家云服务提供商提交了结果。他们占了所有参赛作品的 90% 以上。


这是迄今为止英伟达生态系统在 MLPerf 训练测试中的第五次也是最强的表现。


MLPerf 是业界唯一经过同行评审的 AI 训练和推理标准基准,是客户评估 AI 平台和供应商的宝贵工具。


通过速度认证的机架式服务器

百度 PaddlePaddle、戴尔科技、富士通、技嘉、惠普、浪潮、联想和美超微将结果发送到本地数据中心,在一个或多个节点上运行作业。


几乎所有 Nvidia 的 OEM 合作伙伴都在公司认证的系统上进行了测试,这些服务器已经过针对想要加速计算的企业客户的验证。


提交的多样性显示了 Nvidia 平台的广度和成熟度,它为任何规模的公司提供了理想的解决方案。


快速灵活的

Nvidia IA 是唯一一个用于跨所有基准测试和用例提交的平台参与者,展示了多功能性和高性能计算服务器。这些系统快速灵活,可提供客户加快工作所需的生产力。


训练基准涵盖了当今最流行的八种 AI 工作负载和场景——计算机视觉、自然语言处理、推荐系统、强化学习等。


MLPerf 测试是透明和客观的,因此用户可以相信结果以做出明智的购买决定。该行业标杆小组成立于 2018 年 5 月,得到了数十家行业领导者的支持,包括阿里巴巴、Arm、谷歌、英特尔和英伟达。


三年内加速提高了 20 倍

自第一个结果以来,数据显示 A100 GPU服务器 的性能在过去 18 个月内提高了 5 倍以上。这要归功于软件的不断创新,这是英伟达今天的大部分工作。


自三年前首次推出 MLPerf 测试以来,该公司的业绩增长了 20 多倍。这种巨大的加速是公司在提供全栈 GPU、网络、系统和软件方面取得进步的结果。


不断改进软件

最新的进步来自若干软件改进。例如,使用一种新的内存复制操作,英伟达在医学成像的 3D-UNet 基准测试中实现了 2.5 倍的操作速度。


由于可以针对并行处理调整 GPU 的方式,该公司在用于对象检测的 Mask R-CNN 测试中实现了 10% 的速度提升,并为推荐系统实现了 27% 的速度提升。NVIDIA 还执行了独立的重叠操作,对于在许多 GPU 上运行的作业来说,这是一项特别强大的技术。


此外,该公司扩大了对 CUDA 图形的使用,以最大限度地减少与主机 CPU 的通信,使 ResNet-50 图像评级基准的性能提高了 6%。


最后,Nvidia 在 NCCL 中实现了两项新技术,这是一个优化 GPU 之间通信的库。新事物在像 BERT 这样的大型语言模型中将结果加速了 5%。


努力工作

MLPerf 存储库中提供了所有使用的软件,因此每个人都可以获得世界一流的结果。Nvidia 不断将这些优化整合到 NGC(GPU 应用程序的软件中心)可用的容器中。


它是全栈平台的一部分,经过最新的行业基准验证,可从各种合作伙伴处获得,以处理真正的 AI 工作。


【公司名称】四川旭辉星创科技有限公司

【代理级别】成都浪潮Inspur服务器总代理

【销售经理】李经理

【联系方式】座机:028-85596747    手机:13540160369

【公司地址】成都市人民南路4段 桐梓林 商鼎国际2号楼1单元1913

联系我们
您好,咨询客服了解更多促销产品
售前优惠在线咨询
QQ咨询
微信咨询
售前优惠电话咨询专线:
13438344046
售后电话咨询专线:
028-85596747

请用微信扫描二维码

1.737512s