中国最大的服务器供应商浪潮正在推出一套符合开放计算项目的超大规模机架服务器,将专为中国网络玩家设计的成熟人工智能产品推向全球市场。
新系列包括部署在百度自动驾驶汽车项目中的人工智能服务器,根据中国 Scorpio/ODCC 指南开发,现在以 OCP 格式提供。浪潮数据中心和云计算副总裁 Dolly Wu 告诉DCD,这代表了全球两大领先的开源硬件计划之间的交叉融合。其他新产品包括三个服务器模块和一个更高密度的存储单元,这些产品的发布恰逢阿姆斯特丹 OCP 区域峰会。
AI 节点 (ON5488M5) 可容纳多达 16 个 GPU,例如 Nvidia 的 Tesla,采用 4OU 外形尺寸(OU 或开放单元的高度为 48 毫米,而标准机架单元的高度为 44.45 毫米)。吴说,这是最高密度的人工智能节点,具有最强大的计算性能,可用于人工智能训练场景——浪潮提供了一个带有自己的 FPGA 的版本,用于人工智能推理工作。
虽然这对 OCP 世界来说是新事物,但该服务器的一个版本已经在中国部署了五年。百度为其自动驾驶汽车项目委托了一个部门,浪潮按照 ODCC/Scorpio 项目的硬件规范构建了该项目,这是一个类似于 OCP 的中国开源硬件计划,但涉及百度、腾讯和阿里巴巴等区域巨头。
“我们五年前为百度自动驾驶项目设计了这个 4OU、16 GPU 的盒子,”吴说。“它已经被证明并且已经大规模部署了五年。” 她解释说,服务器的主要功能之一是能够池化 GPU,以提高资源的利用率,可以间歇性地用于训练通过。
这三个新的计算节点建立在浪潮的 San Jose 主板上——这是第一款接受 OCP 的英特尔至强 SP 主板。计算节点 1 (ON5163M5) 是一个双插槽、1OU 节点,专为搜索引擎加速、深度学习推理和分析应用而设计。计算节点2(ON5283M5)是一款双路2OU盒子,专为数据加速、I/O扩展、事务处理和图像搜索应用场景而设计。它还可以支持不同种类的半高半长外卡。计算节点 3 (ON5273M5) 是一个双插槽、2OU 单元,适用于 NFV 应用,具有广泛的半高和半长外部卡,并支持 100Gb 以太网。
还有一个 JBOD 存储单元 (ON5266M5),可容纳 34 个硬盘驱动器,在一个 2OU 模块中,吴声称提供“最高密度的存储扩展盒”。它可以用作计算节点的扩展模块,也可以用作整个机架的存储池。
“这比当前的模块多出 13% 的存储空间,”Wu 说。“很难在如此小的外形尺寸中容纳这么多 - 请记住,34 个驱动器可以是 14TB 或 16TB。”
浪潮还为其硬件提供开源管理,融合了 OpenBMC 和 Redfish。这可能非常重要,她说:“OCP 采用率低的原因是缺乏管理软件。并不是每个人都有 Facebook 的资源。我们希望让人们更容易采用这个平台。”
鼓舞人心的?
浪潮是全球第三大服务器供应商,也是中国最大的服务器供应商,但主要与阿里巴巴、腾讯和百度等大型网络玩家打交道。
“我们是唯一一家参与所有六项开源数据中心计划的服务器供应商,”Wu 说,然后停下来帮助DCD列举了这些:Facebook 的OCP、LinkedIn 的Open19、IBM 的OpenPower、英特尔的机架规模设计、微软的项目奥林巴斯和天蝎座/ODCC。
浪潮计划模糊这些举措之间的界限——将 ODCC 服务器设计发布到 OCP 世界是这一努力的一部分,她说:“浪潮的使命之一是在所有平台之间创造协同效应并使用共同的建筑跨越所有这些街区,打造一个真正开放的社区。”
她说,OCP 在人工智能的实施方面落后于 ODCC/Scorpio,因为到目前为止 Facebook 对使用人工智能表现出的兴趣不大。“ODCC 是为广泛的行业领域设计的,而 OCP 主要被 Facebook 使用,目前他们对 AI 的消耗并不高,”她解释说。“现在,他们想要分析行为以根据活动来定位广告。”
【公司名称】四川旭辉星创科技有限公司
【代理级别】成都浪潮Inspur服务器总代理
【销售经理】李经理
【联系方式】座机:028-85596747 手机:13540160369
【公司地址】成都市人民南路4段 桐梓林 商鼎国际2号楼1单元1913
请用微信扫描二维码