-
CUDA 支援 ARM 是达成百万兆级超级电脑的新途径,还是 Nvidia 和
作者: 发布: 2020-06-06 分类: P卫生活 阅读: 619次
超级电脑(Supercomputer)在科学界常视为国家技术领军能力的指标,因能为 AI、空气动力、大气科学、能源科学等重要技术的研究提供算力支撑。如今强国竞争已进入百万兆级时代,就需要更强大的处理器。目前 x86、Power 为超级电脑 CPU 计算节点的主要架构,那幺 Nvidia 宣布 CUDA 支援 Arm,谁将是最大赢家?
超算竞争进入百万兆级时代去年 6 月,美国能源部公布了世界最快的超级电脑 Summit,反超中国超算太湖之光重夺超算 TOP500 第一的位置,美国并表示,他们预计在 2021 年建造一台每秒运算数十亿亿次的电脑「极光」(Aurora),甚至打造更高效能的电脑。
2019 超级电脑 Top 500。
当然,中国也在建立百万兆级超级电脑系统,有消息称基于已构建的 3 种原型系统:曙光、天河和神威。日本和欧洲也不甘落后,日本希望在 2021 年有一台百万兆级的超级电脑,欧洲人则在希望在 2023 年达成这目标。显然,超级电脑的竞赛跨入了 Exascale 计算(百万兆级计算,也称 E 级超级电脑)时代。
用不精确的说法解释百万兆级计算,一个百万兆级电脑瞬间进行的计算,相当于地球所有人每天每秒不停计算 4 年。这样强大的计算能力需要更複杂的系统。与普通电脑一样,超级电脑同样由硬体和软体系统组成,但超级电脑仅硬体部分就由高速运算系统、高速互连通讯网路系统、储存系统、维护监控系统、电源系统、冷却系统和架构组装设计等部分组成。
其中,高速运算系统负责逻辑複杂的排程和串列工作和并列度高的工作,可採用同构计算(纯 CPU 组成计算节点),也可以採用异构计算(CPU+加速器组成计算节点)方式。
实现百万兆级超算的新途径根据国际组织 TOP500 编制的超级电脑榜单,从 2019 年度 ISC 国际超级电脑大会公布的超算效能 500 强榜单,不难发现 IBM Power、Nvidia Volta / Tesla、Intel Xeon 显然是超级电脑计算节点的重要组成。
2019 年度 ISC 国际超级电脑大会公布的 Green500。
但是,随着算力进一步增强,超算产生的热量不仅会造成更多资源消耗,冷却系统设计同样面临更大的挑战,因此没瓦特徴能也十分重要。TOP500 也编制了 Green500 的超级电脑排行榜,这个排行榜比的不是效能,而是比每瓦效能,所以,即便某个超级电脑在 TOP500 榜单垫底,在 Green500 却可能获得好名次。
根据最新 Green500 排行榜,全球最节能的 25 款超级电脑中,22 款都得益于 Nvidia 的支援。
关键之一就是採用异构计算方式,让 x86 或 Power 架构的 CPU 与 Nvidia GPU 合作,将繁重的处理作业卸载至更节能的并列处理 CUDA GPU。不过在 CPU 市场,Arm 架构也不能捨弃,那幺在超级电脑的百万兆级竞争,Arm CPU 是否也能发挥优势?
现在下结论还为时尚早,但 Nvidia 并不打算错过可能的机会。6 月 17 日,2019 年度 ISC 国际超级电脑大会,Nvidia 宣布将于年底前提供 Arm 生态系统全堆叠 AI 和 HPC 软体,此堆叠为 600 多个 HPC 应用程式和所有 AI 框架提供加速,包括所有 Nvidia CUDA-X AI 和 HPC 程式库、GPU 加速的 AI 框架和软体开发工具,如支援 OpenACC 的 PGI 编译器和效能分析器。
这也就意味着,Nvidia 的堆叠最佳化完成后,将为所有主要 CPU 架构提供加速,包括 x86、Power 和 Arm。
Nvidia 创始人兼首席执行长黄仁勋表示:「超级电脑是促进科学发现的重要工具,建立百万兆级超级计算将能极大延伸人类知识的边界。随着传统计算规模延伸步伐停止,功率也将成为所有超级电脑的限制因素。Nvidia CUDA 加速计算和 Arm 的高能效 CPU 架构结合,将助力 HPC 社群大幅提升,达到百万兆级。」
Nvidia 的好生意从百万兆级超算建造者的角度看,Arm CPU+Nvidia GPU 是个新选择,但从 Nvidia 的角度看,CUDA 支援 ARM 不只简单宣布,而是资源投入。让 Nvidia 有动力投入,是各国和巨头公司的需求和热忱。
仅美国方面,下一代超级电脑技术研发总投入将达 4.3 亿余美元,美国能源部部长里克‧佩里就表示,这些资金剑指「下阶段研发百亿亿次系统的全球竞赛」。显然,百万兆级超级电脑构建少不了 Nvidia 的 GPU,特别是 AI 技术蓬勃发展且越来越重要的当下。此时 Nvidia 又联合 ARM 为构建百万兆级超级电脑提供新途径,自然能让其从超级电脑市场获得更多营收。
Nvidia 在超级电脑市场的努力不只 CUDA 支援 ARM,2019 年度 ISC 国际超级电脑大会还宣布全球速度排名第 22 位的超级电脑 DGX SuperPOD。根据 Nvidia 的说法,此超级电脑系统採用 96 台 NvidiaDGX-2H 超级电脑,内含 1,536 颗 Nvidia V100 Tensor Core GPU,由 Nvidia NVSwitch 及 Mellanox 网路架构联结。处理能力高达 9.4petaflops,能用于训练安全自驾车所需的海量深度神经网路。
对比来看,具备同等效能的其他 TOP500 超级电脑系统需要由数千台伺服器构建,而 DGX SuperPOD 占地面积更少,体积比同等系统小 400 倍左右。部署方面,其他同等规模的系统通常需要 6~9 个月才能完成,DGX SuperPOD 在工程师採用经验证的规範性方法下,仅需 3 星期。
Nvidia DGX 系统已服务众多对大规模计算有需求的企业机构,例如 BMW 、Continental、福特与 Zenuity 等汽车公司,还有 Facebook、微软与富士软片等公司,还有研究领域的日本理化学研究所与美国能源部实验室等。
Nvidia 希望还没有部署人工智慧资料中心的企业机构使用 Nvidia SuperPOD 架构,可让双方都获益,不只如此,Nvidia 还能透过构建超级电脑,学会如何设计针对大规模人工智慧机器的系统。
显然,超级电脑特别是百万兆超级电脑,对 Nvidia 是多赢的好生意。
ARM 的好机会对 ARM 而言,百万兆级超级电脑市场则是个好机会。在行动市场占据领导地位的 ARM 遇到市场增长放缓时,同样也希望拓展到新市场,近年来也在努力联合伙伴推动 ARM 伺服器发展,不过情况并不理想。
但在超级电脑市场,特别是 CUDA 支援 ARM 后,ARM 迎来了好机会。Atos 进阶执行副总裁、大数据和网路安全部门负责人 Pierre Barnabé 表示:「凭着万宝龙专案,以及为百万兆级超级电脑 BullSequana X 所做的 ARM 计算刀片设计,Atos 成为 ARM 生态系统的先驱者。」
全球重要超级电脑提供商 Cray 总裁兼首席执行长 Peter Ungaro 表示:「我们的 Cray 系统管理和程式设计环境(编译器、程式库和工具)已能在 XC 和未来的 Shasta 超级电脑支援 ARM 处理器,将 CUDA 和 CUDA-X HPC、AI 软体堆叠用于 ARM 平台,并将之与 Cray 系统管理和程式设计环境紧密整合,助力超级电脑实现愿景。」
另外,Ampere Computing、CSC、EPI、HPE、Jülich 超级电脑中心、Marvell 等都表达对 CUDA 支援 ARM 的期待。同时还会看到,CUDA 支援 ARM 能建造百万兆级超级电脑,同样也能让伺服器厂商更方便製造 ARM 伺服器,所以 ARM 的好机会是更能拓展架构优势。
小结百万兆级超级电脑是各国努力打造的新一代超级电脑,此时 Nvidia CUDA 支援 ARM,给正在打造新一代超级电脑的国家及对算力有更高需求的企业一个新选择,这既是 Nvidia 能多赢的好生意,更是 ARM 进入超级电脑市场的好机会。现在有众多支援者表态支持新路径,虽然对此保持积极态度,但结果仍需透过实际百万兆级超级电脑系统得出。创新虽不会百分之百成功,但是推动革新的最大动力。
- 站长推荐
- 最近发表