四川成都浪潮服务器销售中心_浪潮信息发布元脑CPU推理服务器:推动大模型普及应用

Admin 17 2025-03-27 11:30

近日,浪潮信息宣布推出元脑CPU推理服务器,可高效运行DeepSeek和千问QwQ等新一代大推理模型。元脑CPU推理服务器NF8260G7NF8480G7设计采用4颗高性能通用CPU和多通道内存系统,通过先进的张量并行策略和AMX加速技术,单机即可高效运行DeepSeek-R1 32B和QwQ-32B推理模型,单用户性能超20 Tokens/s,可同时处理20个并发用户请求,是企业快速、易获得、低投入部署上线大模型平台的理想算力选择,将加速DeepSeek带动下AI落地普及速度。

image.png

大模型行业应用落地加速,DeepSeek-R1 32B、QwQ-32B等模型中文能力见长,并在理解能力和知识储备上有显著优势,是企业平衡性能和部署成本的顶级模型选择。元脑CPU推理服务器仅基于通用处理器进行软硬协同优化,可为企业32B模型推理与云计算、数据库等通用关键业务场景融合提供更高效、更灵活、更稳定的AI通用算力支撑。

大模型爆火背后的机遇与困境

春节过后,DeepSeek的爆火将AI应用推向新高度,其7天内活跃度突破1亿,引发千行百业竞相拥抱AI。浪潮信息副总经理赵帅表示:“DeepSeek的爆火,让AI真正走进了千家万户,许多资深同行都主动询问相关信息,这在以往是难以想象的。它创造了大量实际落地业务价值,推动各行业积极探索AI应用。”

但是在DeepSeek火爆的背后是算力稀缺,尤其是好用、易用的算力获取困难,成为制约大模型发展的关键因素。中小企业、教育科研用户更是陷入两难境地:将私有数据上云面临安全风险;部署满血版服务器,初始投资高昂且并发需求不匹配。

赵帅指出:“中小企业和教科研用户对易于部署、易于管理、易于使用的入门级AI推理服务需求强烈,他们希望服务器更便于部署和管理,控制成本,并能将AI融入日常业务,实现多业务协同管理。这是市场的现实需求,也是我们发布元脑CPU推理服务器的重要出发点。”

元脑CPU推理服务器:软硬协同创新破解应用难题

为满足市场需求,浪潮信息推出元脑CPU推理服务器,这款产品在技术上实现了一系列突破。

在硬件层面,以4路服务器为例,其单机可支持2TB以上内存,强大的内存扩展能力为模型运行提供充足空间。浪潮信息人工智能与高性能应用软件部AI架构师Hongyan SUN解释道:“随着CPU技术发展,内存带宽不断提升,从早期8通道发展到如今的16通道,还有MRD新型内存技术助力。这使得CPU服务器在运行大模型时,即便面对如671B这样存储需求大的模型,也能凭借大容量内存实现良好运行效果。”

软件优化同样至关重要。服务器采用先进的张量并行策略和AI加速技术,如英特尔的AMX加速功能。浪潮信息人工智能与高性能应用软件部AI架构师Owen ZHU介绍:“在32B推理中,我们运用TP并行技术,将权重分成四份存入对应CPU内存,充分利用整机内存带宽,相比单CPU内存带宽使用,可提升至1.2T。同时,采用AWQ量化技术,通过逐通道测放和网格搜索找到最佳缩放因子,有效减少量化误差,提升模型性能。”

软硬协同优化更是这款服务器的核心亮点。赵帅强调:“AI推理不是单纯的硬件工作,软硬件协同才能发挥最大性能。我们的AIStation、EPAI等软件平台,能让用户快速上手使用大模型,根据自身场景选择最合适的模型,降低使用门槛,提升使用体验。”

差异化定位,推动AI应用普及

市场中,DeepSeek一体机已占据一席之地,元脑CPU推理服务器与之相比有何不同?

赵帅分析:“满血版DeepSeek一体机适用于中大型企业,这些企业有较高的技术实力和成本承受能力,对模型参数数量和并发数要求较高,一般并发数在两三百以上才能发挥其最大价值。而我们的元脑CPU推理服务器主要面向中小企业市场,这类企业更注重成本控制,对AI应用处于起步阶段,希望将AI融入现有业务。元脑CPU推理服务器稳定性强、易维护、支持多种负载,既能与企业现有IT基础设施无缝融合,也避免了专用AI硬件的局限。”

例如,在一些中小企业的日常办公场景中,服务器不仅可以运行AI推理任务,辅助员工进行文档撰写、数据分析等工作,还能同时承担数据库管理、邮件服务等传统业务,实现一机多用,提升企业运营效率。

多元应用场景,解锁无限可能

元脑CPU推理服务器的应用场景十分广泛,除了常见的大模型对话,还在RAG(检索增强生成)、长文本处理、多模态任务等领域展现出潜力。

在RAG业务支持上,赵帅表示:“RAG技术对企业模型的微调至关重要,但它并非由推理服务器独立完成。浪潮信息的元脑企智EPAI大模型平台,联合ISV合作伙伴,帮助用户对数据进行微调,使模型更贴合业务需求。推理服务器则根据模型参数、并发规模和场景选择,为RAG业务提供算力支撑。”

针对长文本处理,Hongyan SUN表示:“在RAG场景下,我们预先处理和计算检索文档的KV值并存储在硬盘,用户加载时可直接提取,减少冷启动时间。同时,通用服务器大容量内存为KV Cache存储提供便利,不过受限于计算能力,在长文本快速输出方面存在一定挑战。我们正在研究新的KV Cache技术,预计今年下半年发布,进一步提升长文本处理能力。”

在多模态任务方面,虽然目前尚未成为服务器的主要应用方向,但随着技术发展,其潜力不容小觑。Owen ZHU认为:“随着多模态技术的成熟,我们的服务器凭借强大的计算能力和灵活的软件适配性,未来有望在图像、语音与文本融合的多模态应用中发挥重要作用,为企业提供更丰富的服务。”

市场反馈热烈,前景一片光明

产品推出后,市场反馈如何?赵帅透露:“目前市场热度极高,已有大量客户咨询,涉及金融、教育、中小企业、创业公司、科研团队等多个领域。他们对低成本、易部署、易管理的产品需求迫切,我们的服务器恰好满足这些需求。虽然出于商业保密原因不能透露具体订单量,但可以肯定的是,这款产品市场前景广阔。”

从实际应用案例来看,某金融企业利用元脑CPU推理服务器结合特定大模型,实现智能客服升级,快速准确回答客户咨询,提升客户满意度;某教育机构借助服务器搭建智能教学辅助系统,为学生提供个性化学习方案,提高教学质量。这些成功案例充分证明了产品的价值。

展望未来,赵帅表示:“浪潮信息将持续投入基础大模型研究,深入理解算力需求,优化系统架构。我们还将不断完善产品阵列,从数据中心级AI服务器到CPU服务器、边缘服务器,满足不同客户场景需求。同时,加强网络、存储等方面布局,打造完整AI业务生态,推动AI技术在各行业深度应用。”

CPU推理服务器的出现,为大模型应用困境提供了有效解决方案,其凭借技术创新、差异化定位和多元应用场景,正在市场中崭露头角。随着AI技术不断发展,更加快速、易获得、低投入的理想算力平台将推动AI应用迈向新高度,让更多企业在智能时代实现创新发展。

    【公司名称】四川旭辉星创科技有限公司

    【代理级别】成都浪潮服务器代理商

    【销售经理】李经理

    【联系方式】座机:028-85596747    手机:13438344046

    【公司地址】四川省成都市武侯区群益商务大厦1栋单元4层1-403


联系我们
您好,咨询客服了解更多促销产品
售前优惠在线咨询
QQ咨询
微信咨询
售前优惠电话咨询专线:
13438344046
售后电话咨询专线:
028-85596747

请用微信扫描二维码

0.704719s