中国 Biren 的新 GPU 拥有 770 亿个晶体管,2 PFLOPS 的 AI 性能

Admin 947 2022-08-14 22:46

Biren Technology 正式 推出 了其首款主要为人工智能 (AI) 和高性能计算 (HPC) 设计的 GPU。据该公司称,顶级 BR100 GPU 可以在某些工作负载中挑战 Nvidia 的 A100 甚至 H100 芯片,但其复杂性与 Nvidia 的H100 计算 GPU相当。 


Biren 最初的计算 GPU 系列包括两个芯片。BR100 承诺高达 256 FP32 TFLOPS 或 2 INT8 PetaFLOPS 性能,而 BR104 的额定性能高达 128 FP32 TFLOPS 或 1 INT8 PetaFLOPS 性能。  


顶级 BR100 配备 64GB HBM2E 内存和 4096 位接口 (1.64 TB/s),而中端 BR104 配备 32GB HBM2E 内存和 2048 位接口 (819 GB/s)。 


这两款芯片都支持 INT8、FP16、BF16、FP32 和 TF32+ 数据格式,因此我们不是在谈论超级计算格式(例如 FP64),尽管 Biren 表示其 TF32+ 格式提供比传统 TF32 更高的数据精度。同时,BR100 和 BR104 提供了相当强大的峰值性能数据。事实上,如果该公司将 GPU 特定的功能(纹理单元、渲染后端等)整合到其计算 GPU 中并设计了适当的驱动程序,这些芯片将是相当令人难以置信的 GPU(至少 BR104,大概是单芯片配置) 。

Biren 的 BR100 将以 OAM 形式提供,并消耗高达 550W 的功率。该芯片支持公司专有的 8 路 BLink 技术,每个系统最多可安装 8 个 BR100 GPU。相比之下,300W BR104 将采用 FHFL 双宽 PCIe 卡外形尺寸,并支持多达 3 路多 GPU 配置。两种芯片都使用 PCIe 5.0 x16 接口和 CXL 协议用于顶部的加速器,报告 EETrend(通过 VideoCardz)。 


TRceCZ6NKED7GNqV4AT92c-1200-80.jpg

Biren 表示,它的两款芯片都是使用台积电的 7nm 级制造工艺制造的(没有详细说明它是使用 N7、N7+ 还是 N7P)。较大的 BR100 包含 770 亿个晶体管,超过了 542 亿个晶体管,而 Nvidia A100 也是使用台积电的 N7 节点之一制造的。该公司还表示,为了克服台积电标线尺寸的限制,它必须使用小芯片设计和代工厂的 CoWoS 2.5D 技术,这是完全合乎逻辑的,因为 Nvidia 的 A100 接近标线尺寸,而 BR100 应该是平的鉴于其更高的晶体管数量而更大。 


鉴于规格,我们可以推测 BR100 基本上使用了两个 BR104,尽管开发人员尚未正式确认这一点。 


为了将其 BR100 OAM 加速器商业化,Biren 与浪潮合作开发了一款 8 路 AI 服务器,该服务器将于 2022 年第四季度开始提供样品。百度和中国移动将成为首批使用 Biren 计算 GPU 的客户之一。 


【公司名称】四川旭辉星创科技有限公司

【代理级别】成都浪潮Inspur服务器总代理

【销售经理】李经理

【联系方式】座机:028-85596747    手机:13540160369

【公司地址】成都市人民南路4段 桐梓林 商鼎国际2号楼1单元1913

联系我们
您好,咨询客服了解更多促销产品
售前优惠在线咨询
QQ咨询
微信咨询
售前优惠电话咨询专线:
13438344046
售后电话咨询专线:
028-85596747

请用微信扫描二维码

0.527078s