英特尔第五代至强可扩展处理器,有啥不同?

在新一轮的服务器CPU竞争中,英特尔无疑面临着较大的竞争压力。为此,英特尔加速了下代产品的步伐,在上周推出了第五代至强可扩展处理器。

熟悉处理器市场的人大概记得,代号Sapphire Rapids(蓝宝石激流,SPR)的第四代英特尔至强可扩展处理器也不过是在今年年初才推出。

然而,疯狂的是,还不到一年的时间,英特尔就"迫不及待"的推出了代号Emerald Rapids(绿宝石激流,EMR)的第五代英特尔至强可扩展处理器,可见面对咄咄逼人的AMD,英特尔真的着急了。

Image

今天我们就来看看第五代至强可扩展处理器有何不同?

▉ 第五代至强,新在哪?

在2023年初,配备PCIe Gen4、DDR4和多达40核的英特尔第三代至强可扩展处理器(代号IceLake)还是今年高端市场上最好的产品。

然而,在2023年1月10日,英特尔推出第四代至强可扩展处理器(代号"Sapphire Rapids")将服务器CPU推上更高一层,它带来了DDR5, PCIe Gen5, CXL 1.1 (Type 1和Type 2),并内置加速,最多60个内核等等。

Image

现在,英特尔正式推出第五代至强可扩展处理器(代号 Emerald Rapids)。但是对于业界来说,也没有必要因为快速更新的处理器而惊慌,一个重要的原因是它们之间的平台是相同的。通过升级BIOS,同一台服务器可以支持第四代和第五代Xeon CPU。

说的更明确一点,你可以将Emerald Rapids(第五代)视为Sapphire Rapids(第四代)的改进版本,它们将在相同的平台上工作。英特尔下一个大飞跃的全新平台是可能在2024年6月推出Sierra Fores处理器,是第一款能效核(E-core)处理器,拥有每插槽144个内核。其次是紧随Sierra Forest之后发布Granite Rapids,目前已经看到许多8通道和12通道平台的主板将在2024年推出

下面我们来具体看下第五代英特尔至强处理器在哪些方面做了升级。

Image

通过超精细的7纳米工艺,Intel可以制造更大的芯片组,对于相同尺寸的芯片组获得更高的产量,并且对于更小的芯片组获得更好的产量,因此第五代可扩展处理器分为XCC、MCC和EELCC三种不同的芯片封装创建Emerald Rapids。

Image

Emerald Rapids依然采用的chiplet小芯片设计(XCC版本),但是从四颗Die减为两颗,每颗芯片组排列成7×5个核心的网格(2个被腾出内存控制器空间),每个芯片组有33个核心,总共有66个核心。但为了保证良品率,每颗Die屏蔽一个核心,总共可用最多64个核心,刚刚赶上AMD上一代霄龙。

Image


两个Die之一

虽然第五代英特尔至强处理器现在可以达到64核,但有一个很大的变化,就是64核处理器更便宜(标价),因为英特尔简化了Die设计,从而降低了成本。

除此之外,另一个重要特性应该是大规模升级的缓存,三级缓存是上一代产品的近 3 倍,缓存最大达到320MB。相当于每核心从第四代可扩展处理器的1.875MB增至5MB,接近2.7倍之多。

内存仍然是8通道DDR5,支持高达5600 MT/s的传输速率,且采用英特尔超级通道互联(英特尔UPI)2.0 以增加跨插槽内带宽,提供高达 20 GT/s的传输,以实现更快的CPU到CPU通信。

但是稍显遗憾的是,对于HPC用户来说,这个设计没有HBM选项,抱歉。

Image

看完了XCC再看Monolithic(单体)芯片架构的MCC(Medium Core Count),它针对的是主流市场,高主频、低延时需求。MCC芯片组对外是最多32个核心,可能因为仍是单晶片(Single Monolithic Die)架构的缘故,看起来MCC只做了微调,升级体现在核数、频率、TDP的小幅增加,或者DDR5内存频率上一两个台阶(以400MHz为单位)。

还有一种能效低的Low Core Count(EE LCC)SKU,最多20个核心,主要面向是低端市场,高性价比需求。

另外,英特尔第五代至强处理器加入了CXL 1.1一致性内存协议,允许芯片上的PCI-Express端口支持Type 3 CXL内存,作为内置DDR5主内存的扩展。

Image

这意味着一个人可以在一个系统中添加四个CXL Type 3内存扩展设备,比如下图中的Astera Labs Leo板,可以增加一些CXL Type 3内存扩展器件,在增加容量的同时有效地获得大约12通道的DDR5内存带宽。

Image

另外,英特尔第五代可扩展处理器还提供了 SGX 和 TDX 支持,以及在 SGX 和 TDX 上构建的运行时虚拟机以及容器等一系列机密计算应用。

Image

当然,这款处理器最大的特点是它内置了人工智能功能。不同于AMD那样只有AVX-512 VNNI指令在CPU上运行轻量级AI功能。相反,第五代至强可扩展处理器每个内核都内置了英特尔AMX加速AI模块,AVX-512和AMX都可以在CPU上使用,以提高AI推理的性能。

Image

根据官方给出的数据,基础平均性能较上一代提升21%,而AI推理性能的提升则高达42%,得益于内置的英特尔高级矩阵扩展功能,第五代至强处理器无需搭配独立的AI加速器,就可以直接应付严苛的AI工作负载。

Image

另外,这款全新英特尔至强可扩展处理器能够为客户和广大合作伙伴提供显著的性能提升和整体优势,并实现了面向关键工作负载的性能优化。

Image

看到这里,可能大家觉得,抛开L3缓存的升级,如果从核心角度来看,感觉与第四代可扩展处理器并没有太大区别?

这也是笔者的一个疑问,毕竟对于受疫情和经济大环境影响的客户来说,升级服务器最大的吸引力来源于核心、缓存和I/O等方面的提升,以便在添加新设备的时候能够尽可能的淘汰掉更多的老服务器。也许这款第五代可扩展产品的定位就是更多的是替换第三代至强可扩展处理器,毕竟相比于第三代至强可扩展处理器最高可达40核,第五代可扩展处理的核心数量增加了60%。但与第四代至强相比,核心数量只增加了约7%。

我们先继续往下看。

▉ SKU,区别在哪?

接下来我们来看下第五代至强可扩展处理器的SKU。

Image

特尔在SKU列表上表现得非常克制,只有32个新的SKU。比Sapphire Rapids系列的52个SKU要少很多。也比第一代的"Skylake" Xeon SP也有51个SKU和第二代的"Cascade Lake" Xeon SP有45个SKU也要少。即使是命途多舛且长时间推迟的第三代"Ice Lake" Xeon SP也有38个SKU。

这是不是也从侧面来说第五代可扩展处理器是一个临时替代的处理器?当然这只是我个人的猜测。

在定价方面,迫于竞争压力,这里的定价比Sapphire Rapids反而要低一些。

这里值得注意到的一点是,英特尔正在使用缓存大小作为不同SKU的差异化因素。例如6538Y+和6530都是主流的通用服务器CPU,但是6530的LLC容量却是达到160MB,而6538Y+的LLC容量却只有60MB。

Image

而且,英特尔在加速器上的应用也非常少,尽管在基准测试中突出了这些加速器的效果。

Image

另外,也不是所有的SKU都能够使用DDR5-5600,只有不到22%的SKU才能使用DDR5-5600,而且不是所有的至强白金SKU都使用DDR5-5600。甚至并没有一款SKU能够全部使用DDR5-5600和全套加速器功能,这就有点狂野了。

另外就是,虽然不能让所有SKU都使用DDR5-5600,但如果人们愿意,还是尽量让他们使用更低的成本和更快的内存。虽然价格425美元的3580U或568美元的4510客户不太可能为DDR5-5600内存支持溢价,但是这两个SKU的内存限制在DDR-4400就有点说不过去了,这意味着,即使买了DDR5-4800,这些用户也会超买,这就很愚蠢了。这一点AMD就要做的好一点,不同内核的SKU拥有额外的缓存以及其它更多的功能。

Image

当然,为了方便不同的用户更好的选择适合的处理器,英特尔为不同的SKU在命名的时候带上了不同的字母,P和V代表面向云优化的处理,N代表面向网络的CPU,S则是面向存储和超融合,Q则是面向液冷领域。

Image

值得注意的是,英特尔在新芯片上关注的一个领域是更低的闲置功耗。英特尔表示,它的新服务器在空闲时每个插槽可以节省约100瓦的电力。英特尔在功耗方面也比较克制,并没有在所有高端部件上使用385W,只有在液冷领域使用了385W设计。

Image

根据英特尔提供的资料,第五代英特尔至强可扩展处理器在较低利用率(如30~40%)下的能耗得到优化,可以降低用户的供电和制冷成本。

▉ 市场影响和展望

需要注意的是,在这一代,英特尔的核心数量还不足以与AMD一较高下。但需要注意的是,根据至强产品路线图披露,六个月后的Sierra Forest将开启高核心数量,第一代纯 E 核的 Sierra Forest 至强处理器将达到144核心。第二代 E-Core Only Xeon CPU 代号为 Clearwater Forest,预估最高配备 288 个 E 核

Image

目前来看,核心并不代表着竞争力,虽然多核心的设计非常适合在Linux容器中运行Nginx web服务器,但对于授权软件来说,更少的内核和更高的每核性能才是正确的选择,尤其是非超大规模市场仍然有大量购买32核或16核每个插槽的需求。

如今许多组织都在购买第四代Sapphire Rapids,而第五代Emerald Rapids则是一个非常不错的替换品。

Image

这是因为第五代可扩展处理器使用了很多加速技术。内置加速可以提供更高的每核性能,远远超过简单升级带来的10-15%的改进。同样,我们可以获得新的设备支持,如CXL Type-3设备支持,允许英特尔平台扩展内存容量和带宽,甚至超过今年早些时候推出的新的第四代Xeon平台。

毕竟,目前英特尔每个插槽的核心数量只是AMD EPYC的一半,它需要差异化其SKU的竞争方法。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值