第一生活网

2月17日Nvidia Grace CPU 和 Hopper GPU 首次亮相 Exascale 超级计算机

冉梵毅
导读 Atos 推出了新的 BullSequana XH3000 混合计算平台,可实现百亿亿级超级计算机。新的高性能计算平台与其使用的硬件架构无​​关,因此

Atos 推出了新的 BullSequana XH3000 混合计算平台,可实现百亿亿级超级计算机。新的高性能计算平台与其使用的硬件架构无​​关,因此它与 AMD、Intel、Nvidia 和 SiPearl 的 CPU 以及 AMD、Intel 和 Nvidia 的计算 GPU 兼容。此外,该平台采用液冷,可处理高达1000W功耗的节点。第一个系统将于第四季度到期。

Atos 的 BullSequana XH3000 混合计算平台将为性能从 1 FP64 PetaFLOPS 到 1 FP64 ExaFLOPS(以及人工智能应用程序的 10 FP8/FP16 ExaFlops)的系统提供最大的灵活性,利用将在未来六年内发布的硬件。除了 AMD 和 Intel 的传统 x86 CPU,它还支持 Nvidia 即将推出的基于 Arm 的 Grace 处理器和 SiPearl 的 Rhea 高性能片上系统。此外,正如其混合特性所暗示的那样,该平台可以支持下一代计算 GPU(或加速器),包括 AMD 的基于 CDNA 2/3 的设计、英特尔的 Ponte Vecchio 和 Nvidia 的 Hopper 解决方案。

未来用于数据中心和高性能计算 (HPC) 的 CPU 和 GPU 承诺非常耗电,这就是 BullSequana XH3000 默认设计用于液体冷却的原因。XH3000 将使用 Atos 的直接液体冷却 (DLC) 解决方案,该解决方案承诺提供“比前几代产品多 50% 以上的冷却功率”,并支持功耗高达 1000W 的节点。虽然每个节点 1kW 的功率听起来可能很极端,但看起来这将是未来相当标准的节能 HPC 节点配置。例如,有传言称 AMD 的 Instinct MI250X 功耗高达 550W,而此类单元的行业标准 OAM 外形设计可提供高达 700W 的功率。

目前,我们对 AMD、英特尔、英伟达和 SiPearl 即将推出的 HPC 解决方案的细节知之甚少,但 Atos 声称与它们兼容的事实表明,它们的一般特性(例如,功耗)是已知的服务器制造商。事实上,Nvidia 表示它已与 Atos 合作构建该平台。

“通过将 Atos 的知名专业知识与 Nvidia AI 和 HPC 技术相结合,并在我们的联合实验室开展工作,该平台将使研究人员能够更快地获得重要见解,以应对超级计算和工业 HPC 中的重大挑战,”全球公司 John Josephakis 说。英伟达高性能计算/超级计算销售和业务发展副总裁。

鉴于第一台 BullSequana XH3000 机器的上市时间,它们很可能会成为首批支持 Nvidia 将于今年晚些时候推出的 Hopper 计算 GPU 的机器之一。

至于互连,BullSequana XH3000 超级计算机架构将支持广泛的网络技术,包括 BXI、高速以太网以及 HDR 和 NDR InfiniBand。

迄今为止宣布的所有三台超级计算机都依赖于 HPE 的 Cray EX 架构,该架构几乎可以使用任何 CPU 和各种计算加速器。如今,Cray EX 系统使用 AMD 或 EPYC(霄龙)或 Intel 的 Xeon Scalable CPU 以及 AMD、Nvidia 或 Intel 的计算 GPU(当 Ponte Vecchio 可用时)。通过添加对 Nvidia 的 Grace 和 SiPearl 的 Rhea 的支持,Atos 提供了一个更灵活的平台(但我们不知道什么可以阻止 HPE 将其架构用于 Grace 或 Rhea SoC)。

“我们为我们作为高性能计算领域的领导者和今天公布的新型 BullSequana 超级计算机感到非常自豪,它是 15 年研发努力的成果,汇集了 Atos 在高性能计算、人工智能、量子、安全和数字脱碳,”Atos 首席执行官 Rodolphe Belmer 说。“毫无疑问,它将通过百亿亿次级的门户实现未来的一些关键科学和工业创新突破。”