中国服务器制造商浪潮周二发布了元 1.0,这是最先进的深度学习语言模型之一,可以生成连贯的中文文本。
据该公司称,该模型使用 2457 亿个参数进行训练——这是人工神经网络中的权重数量。这比 Elon Musk 支持的GPT-3英语语言模型还多,后者有 1750 亿个参数。浪潮表示,Yuan 模型是用 5 TB 的数据集训练的。
元的发布是中国自然语言处理(NLP)行业的一个里程碑。NLP 是人工智能服务器 (AI) 的一个重要分支,也是计算机理解人类语言的支柱。
浪潮在一份声明中表示,其人工智能研究院必须开发“一种与英语相比独特的开发方法”来训练模型,包括解决诸如“缺乏事先高质量的中文语料库”等挑战。语料库是用于训练语言模型的文本集合。
浪潮机架式服务器表示,该语言模型“非常擅长”自然语言生成 (NLG) 任务——使用计算机生成自然语言文本的处理。该公司在 10 月份发表的一篇论文中表示,“只有不到 50% 的时间”人类测试人员可以区分模型生成的文本和人工编写的文本。
浪潮在一份新闻稿中表示,元可用于生成包括新闻文章和诗歌在内的文本。
2021 年 5 月,乔治城大学的一组美国研究人员发现强大的 NLG 工具可用于助长虚假信息。浪潮承认这种可能性,并承诺监督该模型的适当使用。
“由于该模型可以生成难以检测是否为人工编写的文章,因此误用的风险变得更高,”浪潮发言人周二告诉 TechNode。“因此我们需要在未来规范该模型的应用。”
该发言人表示,该公司计划将该模型作为应用程序编程接口 (API) 向开发人员开放,这意味着他们可以访问浪潮的平台并在其应用程序中使用该语言模型。
根据市场研究公司IDC 的数据,总部位于济南的浪潮是全球第三大服务器制造商。这家拥有 72 年历史的国有企业曾经是一家电子设备制造商。它于1995年作为美国芯片制造商英特尔的合作伙伴首次进入服务器市场。
【公司名称】四川旭辉星创科技有限公司
【代理级别】成都浪潮Inspur服务器总代理
【销售经理】李经理
【联系方式】座机:028-85596747 手机:13540160369
【公司地址】成都市人民南路4段 桐梓林 商鼎国际2号楼1单元1913
请用微信扫描二维码