2018年高性能计算的得与失

最新推荐文章于 2023-03-31 15:12:04 发布

北海以渔

最新推荐文章于 2023-03-31 15:12:04 发布

阅读量233

点赞数 1

分类专栏：超算仿真文章标签：高性能计算 2018年总结

本文链接：https://blog.csdn.net/weixin_44450143/article/details/86630499

版权

超算仿真专栏收录该内容

15 篇文章 0 订阅

订阅专栏

HPC的一些发展新趋势在2018年持续火热，除此之外也有一些惊喜。让我们仔细看看这一年的发展状况。

Exascale计划收集速度

随着第一批exascale超级计算机计划在未来两到五年内投入生产，各地区的所有主要工作都在2018年取得了重大进展。首先，中国通过安装原型机将所有三个exascale平台投入使用。与此同时，富士通推出了A64FX，这款Arm芯片主要为日本首个exascale系统供电。7月，欧洲处理器计划（EPI）开始实施，其欧盟授权为其exascale和pre-exascale超级计算机开发两种国产处理器。今年4月，美国向即将推出的能源部RFP的exascale机器向前迈出了一大步将系统放在Oak Ridge，Argonne和Lawrence Livermore国家实验室。而在9月份，Hyperion Research提供了一个很好的总结，其中列出了各种exascale工作的位置以及不同参与者花费了多少。
在这里插入图片描述
英特尔制定了一些路线图

英特尔阐述了其未来数据中心处理器的计划，包括其主流Xeon CPU和AI芯片组合。（但在英特尔，每个芯片都会在某种程度上进行AI。）

5月，在公司首次举办的AI DevCon活动中，AI Products Group的负责人Naveen Rao概述了他们开发人工智能平台的多管齐下的方法。NNP的前身是Lake Crest，它已被降级为仅用于软件开发的测试芯片。从未提及针对机器学习的Xeon Phi变种Knights Mill。英特尔也在研究离散的推理加速器。

最新的Xeon路线图稍微简单一点，虽然它也需要一些有趣的转弯。基本上，接下来的三款Xeon处理器被英特尔推出，分别是Cascade Lake，Cooper Lake和Ice Lake。Cascade Lake是一款14nm CPU，它将采用一些Spectre和Meltdown修复程序，一套新的深度学习指令和Optane内存支持。它应该在今年第四季度开始出货，但显然已经进入2019年第一季度。Cooper Lake，同样是14纳米的处理器，它支持深度学习，支持bfloat16格式。最后一个，Ice Lake将采用英特尔推迟延迟的10nm工艺制造，并计划于2020年交付。

更具体的HPC设置是Xeon高性能（AP）处理器的新系列，具有更好的浮点性能和更大的内存带宽。其中第一个将是Cascade Lake AP，它将配备48个内核和12个DDR4内存通道。AP版本应该与其主流兄弟Cascade Lake SP同时发布。尽管英特尔尚未公开发布第二代AP产品，但在泄露的路线图中提到了7月份进入新闻界。

AMD希望利用英特尔Missteps

AMD凭借其去年推出的原装EPYC CPU建立了很高的可信度。该处理器甚至正在进入少数HPC集群，Cray，HPE，戴尔和其他供应商现在支持该芯片。但它是代号为罗马的第二代EPYC，它准备在高性能计算方面做出更大的贡献。

虽然罗马直到明年才会发布，但AMD已经在建立这样一个案例，即这款新的64核处理器将能够超越英特尔最优秀和最聪明的人。与最初的EPYC不同，罗马更直接地瞄准具有表现意识的客户，承诺每个插槽的触发器数量是其前身的四倍，内存带宽高达400GB/秒。这可能足够快，足以超越英特尔在2019年提供的最佳性能产品，即前面提到的48核Cascade Lake AP处理器。

AMD的优势可能归结为罗马将建立在台积电的7纳米制程技术基础上，而英特尔将在2019年停留在其14纳米技术上。随着英特尔的10纳米计划陷入混乱，AMD首次有机会利用基础与主要竞争对手相比，用更小的晶体管构建芯片的优势。如果这成为现实，它将迫使英特尔追赶，这是自从AMD十多年前用其Opteron处理器掠夺英特尔以来没有发生的事情。

NVIDIA巩固其作为首选加速器的优势

今年NVIDIA看到其爱好AI的V100 GPU成为这个星球上一些最强大的超级计算机的关键组件。其中最引人注目的是美国能源部的Summit和Sierra机器，根据11月的TOP500排名，它们现在是世界上最强大的两个系统。Summit排名第一，Linpack标记为143.5 petaflops，Sierra紧随其后，为94.6 petaflops。虽然这些系统配备了IBM Power9 CPU作为主处理器，但V100加速器为这些机器中的绝大多数触发器供电。

尽管这两款超级计算机主要用于运行传统的HPC仿真，但它告诉我们在Summit开启后不久，它的管理员宣布该系统已经使用V100 Tensor核心的低精度功能执行了世界上第一个“exascale”应用程序。预计这些相同的Tensor Core将在Summit和Sierra上运行更多传统的机器学习工作量。

V100硬件是日本新的AI桥接云基础设施（ABCI）系统的基础，该系统目前是世界上第七大功能最强大的超级计算机Linpack-wise。与Summit和Sierra不同，它专门用于运行机器学习应用程序，尽管它也将托管更传统的HPC。

V100还提供了DGX-2背后的计算能力，这是NVIDIA的第二代“AI超级计算机”，可提供两千万亿次的Tensor Core数字运算。它拥有16个V100 GPU，由NVIDIA定制的NVSwitch结构粘合在一起。虽然主要针对人工智能研究商店，但今年有四个DOE实验室安装了DGX-2系统，主要用于机器学习工作，但在某些情况下，将科学模拟与神经网络处理相结合。

如果这还不够，V100将在2018年加入其云计算领域，并于2018年进入Azure，Google云，Oracle云和IBM的裸机云产品。这与亚马逊网站2017年以前的V100部署有关。服务和大型中国云提供商。

硬件的突破年

对于HPC社区爱好者来说，2018年将被视为一个分水岭年。在2018年下半年，桑迪亚国家实验室安装了Astra，这是世界上第一台由Arm微处理器驱动的petascale超级计算机。在11月的TOP500排行榜中，排名第204位，Linpack排名为1.5 petaflops。

更令人鼓舞的是，现在可以从各种系统供应商那里获得Arm-powered super。Astra由HPE提供，Isambard是Cray机器，CEA系统来自Atos。所有这些系统背后的Arm处理器是ThunderX2芯片，这是Marvell现在拥有的一项技术。

硅

这一年开始时出现了一个不祥的预兆，发现了Spectre和Meltdown的漏洞，这些漏洞被发现在大多数CPU平台上都很普遍。简而言之，据透露，常见的处理器功能在Specter的情况下的推测性执行行为，以及在Meltdown的情况下对竞争条件的处理，可能使使用这些CPU的每个系统都容易受到安全漏洞的攻击。

芯片供应商以及云计算公司，操作系统提供商和网络浏览器开发人员都试图以软件和固件修复的形式插入漏洞。其中一些修复不可避免地影响了性能，HPC用户认为这些问题特别令人不安。尽管响应速度很快，但每个人最终都对其他漏洞可能潜伏在硅片上感到有点不安

进步：量子飞跃

2018年在量子计算领域取得了“突破”，其中有许多关于硬件和软件进步的公告。看看大公司，英特尔发布了一款名为Tangle Lake 的49-qubit芯片，谷歌宣布它已经构建了一个72比特的处理器，以实现量子至上，富士通推出了基于自己的量子退火处理的量子计算服务，与IBM继续收集用户到其量子云服务。在创业领域，Rigetti基于自己的16-qubit和32-qubit处理器启动了云服务，

就在本月，IonQ宣布开发出一种至少具有79个可用量子位的器件。与此处提到的所有其他解决方案不同，IonQ的量子比特基于捕获的离子，与竞争技术相比，该公司称其在稳定性方面具有显着优势。

当然，人工智能/机器学习技术继续向HPC中心发展，以后还有更大的发展空间。

本文首发HPC365官网