Neoverse Roadmap

269 篇文章 398 订阅

快速链接:
.
👉👉👉 个人博客笔记导读目录(全部) 👈👈👈

在这里插入图片描述

在这里插入图片描述

两年前,Arm 推出了Arm Neoverse,这是他们针对基础设施的正式举措。在发布公告时,Arm 并未为数据中心提供有吸引力的产品。Cosmos平台只是针对基础架构调整的Cortex-A72,提供了更低的功耗,但仅此而已。对于数据中心来说,性能是关键。Arm 确实宣布了一个 5 年路线图,他们承诺通过其后续平台:Ares、Zeus和Poseidon提供 30% 或更高的性能。

去年Arm 推出了Neoverse N1,代号为 Ares,他们的第一个设计与 Cortex 不同的基础设施。N1 在单线程性能方面比 Cosmos 平台提高了 60% 左右。除了 N1,Arm 还推出了 E1 平台,这是一个更轻的内核,旨在通过多线程实现吞吐量。Neoverse N 系列本质上是 Arm 的主流基础架构系列,具有相当平衡的 PPA,可满足您对数据中心服务器处理器等产品的 TDP 范围的期望。Neoverse E 系列是围绕吞吐量设计的。在这里,功率和面积占据了前排座椅的作用,推动了设计的考虑。今天,Arm 宣布了一个名为 V 系列的新 Neoverse 系列,其中性能比任何东西都更能推动决策。我们已经看到 Arm 采取了类似的举措今年早些时候推出了他们的 Cortex-X 系列。这些内核进一步推动了单线程性能,放松了限制 Neoverse 主要系列的传统 PPA 限制——即使以一些面积和功率为代价。鉴于Cortex-A76和Neoverse N1之间的相似性,我们可以预期 Cortex-X1 和新的 Neoverse V1 之间有很多重叠。这样做显然是为了让 Arm 客户能够集成一些更强大的内核,并在单线程性能上更好地与即将推出的最佳 x86 内核竞争。
在这里插入图片描述

Neoverse V1

今天,Arm 还宣布了 V 系列中的第一个平台 Neoverse V1,代号为 Zeus。根据他们最初的性能测量,Arm 声称与 Neoverse N1 相比,单线程性能提高了 50% 以上。由于 Neoverse N1 主要基于 Cortex-A76;如果我们假设 Neoverse V1 将基于 Cortex-X1,仅 IPC 增加 50% 听起来非常合理。

尽管这纯粹是一个路线图公告,而不是架构披露,但 Arm 确实选择分享 V1 将成为第一个支持可扩展矢量扩展 (SVE) 的 Arm 内核。除了主要为 HPC 市场设计的 Fujitsu A64FX 外,我们还没有看到任何其他承诺对这个五年前首次宣布的扩展作出承诺。SVE 的一个独特方面是它能够与向量长度无关(尽管是 128 位的倍数),允许实现来决定最适合其市场的向量长度。对于 Neoverse V1,Arm 选择实现两个 256 位向量单元。256 是一个有趣的选择,原因有几个。首先,这使所有先前 Arm 设计的 SIMD 吞吐量翻了一番。Cortex-A78及其Neoverse N1表弟有两个 Neon 管道,每个管道都是 128 位的。其次,V1 SIMD 单元的宽度是 A64FX(以及所有最近实现 AVX-512 扩展的英特尔大内核)的一半,这是第一次允许在真实硬件中对 SVE 矢量分区进行比较和压力测试。V1 还将引入bfloat16支持。
在这里插入图片描述

Neoverse N2

随着 V1 的发布,Arm 还宣布了 Neoverse N1 的直接继任者,即 N2 平台,代号为 Perseus(一个新的代号)。根据他们的初始性能测试,Arm 预计在相同的功率和面积效率下,单线程性能比 Neoverse N1 提高 40% 以上。由于最初的 Neoverse N1 基于 Cortex-A76,我们可以预期 N2 将基于最近推出的A78或可能的下一代 Cortex(Matterhorn)。鉴于这是一个高级路线图公告,而不是架构披露,今天只披露了一些细节。对于 N2,Arm 预计其横向扩展能力将得到显着改进,与 N1 相比,在固定功率预算下允许更多内核以更好的性能。就功能而言,Neoverse N2 还将引入 SVE 支持,但将保留与前几代 (128b) 相同的 SIMD 单元大小,这意味着我们现在将拥有三种不同的 Arm 设计和三种不同的 SVE SIMD 大小。N2 也将引入BFloat16支持。
在这里插入图片描述
像往常一样,很难说我们可以从一张营销幻灯片中推断出多少,但我们想强调一些有趣的点。一方面,下面的幻灯片列出了数据中心的 TDP 范围从 80 到 350 W。这些数字远远超过了 Arm 之前谈论的任何东西(例如,对于 Neover N1,即使对于数据中心,Arm 所谈论的 TDP 范围也在 150-225W 范围内)。此外,虽然核心数量等因素在很大程度上取决于 TDP 和其他设计考虑因素,但 N2 幻灯片清楚地列出了多达 192 个核心,比最初为 N1 列出的核心数量增加了 50%。
在这里插入图片描述

Poseidon Platform

再往前看,Arm 计划在 2022 年推出 Poseidon 平台。这与 Arm 提出的原始路线图略有不同,Arm 最初列出了 2021 年的 Poseidon,但没有提到 Perseus 平台,因此很明显他们的路线图非常动荡。Arm 表示,对于 Poseidon 平台,他们承诺将性能提高 30%,但仔细审查今天概述的路线图表明基础设施工作负载性能以及 ML/Vector 提升,而不是表明我们应该期望的单线程性能.

尽管技术细节不多,但 Arm 的新路线图更新仍然很重要。当该公司宣布打算全面投入数据中心时,他们就性能和能力做出了重大承诺。两年后,Arm 在实现其整体性能目标方面已经步入正轨。Neoverse 与 V 系列的扩展使 Arm 能够更好地细分其 IP,并满足对 CPU 市场的高端需求,例如一些数据中心运营商和 HPC 市场的需求。

在这里插入图片描述

参考

Arm Updates Its Neoverse Roadmap: New BFloat16, SVE Support


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

代码改变世界ctw

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值