浮点数例外 (核心已转储)_Ice Lake开始10 nm，新核心（译）

最新推荐文章于 2024-06-06 16:27:30 发布

weixin_39661405

最新推荐文章于 2024-06-06 16:27:30 发布

阅读量642

点赞数

文章标签：浮点数例外 (核心已转储)

Ice Lake开始10 nm，新核心 但较低时钟频率将减少传统性能增益 Tom R. Halfhill (8月12日, 2019)

Intel在处理器性能上的历史性进程终于碰壁，尽管只是10nm，但已成为一个巨大的屏障。公司采用延期很长的10nm FinFET工艺制造的第一批产品是11种“ Ice Lake”笔记本处理器，一般以更低时钟频率运行，但功耗同14nm前代产品相似。而且，Intel第10代“ Sunny Cove” CPU也无法克服时钟频率下滑的问题。幸运的是，新芯片提供了更快的图形加速器，更大的内存带宽以及其他可能对典型用户更重要的功能。另外，某些型号具有更多的CPU内核。

10nm晶体管比现有14nm晶体管慢，但更小，支持在处理器die上实现更高集成度。受益者是更大的Gen11 GPU，Intel表示，10nm上，比前一代集成显卡快约2倍。另一个受益者是业界第一款集成的Thunderbolt 3控制器。如图1所示，合封14nm南桥chiplet，集成更多新功能，包括1个802.11ax(Wi-Fi 6)控制器以及2个用于处理器和合封chiplet的稳压器。总之，用户可以欣赏10nm工艺Ice Lake所带来的新优势，即使是在质疑其逆向CPU频率和能效的同时。

图1 Ice Lake框图 (新处理器最多集成4个CPU核心，单内核集成2MB L3 Cache。同时集成了比前一代产品大得多的GPU以及新的Thunder-bolt控制器。新合封南桥(PCH)增加了稳压器，支持处理器及PCH chiplet自身。)

作为Intel第10代核心处理器的第一个系列，Ice Lake推出了新的产品编号方案，增加了G后缀以指定图形功能。Ice Lake型号属于公司的U系列和Y系列，分别取代第8代Whiskey Lake和Amber Lake。U系列稳定保持15W的热设计功率(TDP)，面向轻薄型笔记本电脑。Y系列TDP上升到9W，以2合1或带键盘的平板电脑为目标。Ice Lake已经投入量产，Intel预计系统将在今年年前上架。第10代的另一个家族，代号为Comet Lake，将在同一时间针对相同类型的系统首次亮相。

这些新处理器支持Intel的Athena项目，该项目在移动PC中推广新技术。该公司在2011年凭借“ Ultrabook”参考设计率先推出超薄Windows PC，与此同时，它也希望再次改善用户体验。Athena项目推广了新功能，如即时开机，语音激活，延长电池寿命，设备内AI服务以及改进的无线连接。Acer，华硕，戴尔，谷歌，惠普，联想，微软，三星和夏普都计划部署兼容Athena的产品，首批产品将于今年上市。

基本时钟频率下降

除了一个例外，如图2所示，尽管内核数相同，但Ice Lake U系列芯片的基本时钟频率比其Whiskey Lake前代产品低得多。Core i7-1068G7例外，它将最快的基本时钟微调至2.3GHz，而将最快的Whiskey Lake(Core i3-8145U)微调至2.1GHz。但是，新芯片核心和线程数是原来两倍，取代同样配备的Core i7-8665U。后者在标称15W TDP时的基本时钟频率为1.9GHz，但在25W“可配置” TDP时的基本时钟升至2.1GHz。(较高的额定值适用于可以承受更高热量的系统；芯片可以更接近其最大升压频率运行)。因此，在类似功耗水平下，新的四核1068G7比四核8665U快约10％( 28W和25W)。但是，其他Ice Lake U系列芯片的基频比其Whiskey Lake前代低得多。

图2 Ice Lake与第八代笔记本处理器比较 (Ice Lake采用新的“ Sunny Cove”第十代Core CPU和Gen11集成显卡。该图表显示了核心数量，TDP，基频/睿频以及1,000-unit起订的单价。*“可配置TDP-up”规格。(来源：Intel，除了†，Linley Group评估))

更大修改是Ice Lake Y系列。部分基本时钟频率下降50％以上。Y系列其中两款基本频率低于1.0GHz，甚至到了多年未见的兆赫兹。但是，Y系列标称的TDP上升到9W，而前一代Amber Lake的TDP则为5W或7W。原因是Y系列多数芯片都是四核，而所有的Amber Lake芯片都只有双核。对于这些型号，Ice Lake将较低的基本时钟换取更多内核和较高TDP。但是，由于它们的睿频下滑速度不及基本速度，因此当只有两个内核运行时，它们仍然非常快。

Intel在U系列中共发布6款处理器，Y系列5款处理器。Core i3/i5 /i7品牌保持不变，但更改了产品编号。为了兼容新一代数字，前两位数字始终为10，仅剩下两位数字来表示相对性能。与前几代产品不同，最后三位数字与前几位完全不同(请参阅MPR 9/3/18，“Intel Pours Whiskey Lake for Laptops”)。

Intel还删除了产品编号末尾的系列名称(如U或Y)。该公司仍使用传统名称来称呼该系列，并且产品编号的最后一位数字现在对应于该系列(Y系列为0，U系列为5)。新的G1/G4 /G7后缀表示集成GPU的大小-数字越大，执行单位(EU)越多。拥有48个或64个EU的最大GPU称为 Iris Plus品牌，该品牌以前是为集成额外64MB嵌入式DRAM的产品保留的。

所有处理器供应商的时钟频率进程都已放缓，无论采用哪种IC工艺。但是Ice Lake是Intel第一个倒退，没有以时钟频率换取较低功耗。相对该公司花了四年时间研发的14nm晶体管而言，较小的晶体管速度反而较慢。考虑到公司将该工艺推向市场的另外四年的昂贵开发代价，能否降低成本也令人怀疑。但对多数人来说，PC已经足够快。该文作者相信，典型用户将从更快的集成显卡，更快的I/O接口，更快的内存和更快的Wi-Fi连接中获得更多价值。Ice Lake实现了所有这些目标。

Sunny Cove的灿烂日出

Sunny Cove是Intel四年来首款具有乱序功能的新型CPU。第10代核心架构为位处理，内存分页，加密和其他与安全性相关的操作添加了九个指令集扩展(请参阅MPR 2/4/19，“Intel’s Sunny Cove Sits on an Icy Lake”)。其中一些首次出现在2018年的Core i3-8121U(Cannon Lake)中，但很少出现在实际发售的10nm量产器件之中(见MPR 6/11/18，“ Cannon Lake Misfires”)。

尽管位操作和加密扩展可能会为笔记本电脑用户带来部分好处，但其他功能主要针对服务器。例如，内存分页扩展到五个级别，将虚拟地址空间增加到131,072 TB，将物理地址空间增加到4,096 TB。而且，MK-TME扩展可以加密外部存储器中的数据，这是在管理程序上托管多个虚拟机的服务器中的一项有用功能。

Sunny Cove中还新增了VNNI扩展，Intel将其称为DL Boost。这些指令可加速采用8位整数(INT8)数据的AI推理算法。它们首先在Cascade Lake服务器处理器中使用，将乘累加吞吐量提高3倍(请参阅MPR 9/3/18，“ Cascade Lake Speeds Deep Learning”)。尽管应用程序性能无法实现这一目标，但该公司已使用INT8数据将ResNet-50深度学习模型的速度提高了2.5倍。

相比Skylake CPU，Sunny Cove扩大了L1数据Cache(48KB与32KB)，L2 Cache(512KB与256KB)，L2转换旁路缓冲区(2,048个条目与1,536个)，微操作Cache(2,250个操作与 1,500)，乱序执行窗口(352条指令与224条指令)，最大in-flight load指令数(128条与72条)以及最大in-flight store指令数(72条与56条)。这些都是重大改进。

因此，Intel声称Sunny Cove CPU单周期(IPC)指令执行量比Skylake CPU多18％。尽管对于已经强大的微体系结构而言，这一成就令人钦佩，但对比Ice Lake和Whiskey Lake处理器时，依然无法抵消基本时钟频率下降带来的影响。在执行新扩展的大工作负载时，Ice Lake具有更大潜力。例如，Intel声称DL Boost的峰值推理吞吐量比“其他同类产品”高8.8倍，这显然是针对未加速的AMD处理器的比较。但是，在主流PC工作负载上，Ice Lake的IPC增长18％可能无法弥补其更大的时钟频率下降的问题。

追赶AMD图形能力

不过，Ice Lake似乎更快，因为其Gen11的集成GPU超越了前一代Intel处理器。尤其值得一提的是，在该公司看来，通过集成64个着色器内核或执行单元，排名前三的U系列芯片和前两个Y系列芯片脱颖而出，而Whiskey Lake的Gen9 GPU只有24个。甚至低端G1型号也有32个EU。Gen11的最大时钟频率从900MHz到1.1GHz，大约与以前相同，因此额外的EU有效提高了性能。最大情况下，最快的Gen11 GPU提供了1.12Tflop / s的单精度浮点吞吐量或2.25Tflop / s的半精度吞吐量-至少比Gen9高2倍(请参阅MPR 1/21/19，“Intel Turns Graphics up to (Gen) 11”)。

有了这种巨大的提升，新GPU首次达到AMD集成GPU的性能，并且与入门级图形卡相似。Intel的基准测试结果表明，在某些游戏和一些3DMark测试中，Ice Lake的最佳图形能力稍胜于Ryzen 7图形能力，尽管在某些情况下，它们的速度要慢一些。该公司的类似基准测试表明，在某些游戏中，《Ice Lake》的帧率比Whiskey Lake高80％。该文作者希望独立的基准测试能够大致确认这些说法。从历史上看，Intel的图形能力已经落后于AMD的图形处理能力，因此即使实现等效也是一个里程碑。

为了辅助更快的GPU，Ice Lake升级了媒体加速器，实际是GPU复合体的一部分。两个增强型视频引擎可以以高达60fps(10位彩色，4：4：4采样频率)的帧速率编码4K分辨率视频，或以30fps(10位彩色，4：2：0)的8K视频编码。Intel表示，它们比以前的编码器快2倍。新的图像处理单元可以处理16兆像素的图像，30fps的4K视频或120fps的1080p视频。

与以前型号类似，Ice Lake可以通过DisplayPort 1.4或HDMI 2.0b接口同时驱动三个显示器，显示分辨率为60fps时5K或120fps时4K。这些功能使在Ice Lake瞄准的轻薄笔记本电脑上进行随意视频编辑成为可能，但是重任务仍需工作站级的笔记本电脑或台式PC。

更快解决问题

更快的内存控制器和I/O接口还可以协助Ice Lake补偿其较慢的CPU。双通道64位DRAM控制器可与多达64GB的DDR4-3200内存(在两个64位通道中)或高达32GB的LPDDR4X-3733内存(在四个16位通道中)一起工作。峰值DRAM带宽分别为51.2GB / s或59.7GB / s。相比，Whiskey Lake仅限于DDR4-2400或LPDDR3-2133内存，提供的峰值DRAM带宽不超过38.4GB / s。由于内存通常是当今系统的瓶颈，因此Ice Lake的改进(高达56％)，可以实现机器在人的感觉上更快。

价格和供货情况Intel U系列和Y系列处理器(Ice Lake)于今年夏天开始发货。该公司预计，今年年底之前将有超过35种系统首次亮相。某些产品暂未提供报价；如图2所示，预计价格从300美元到426美元不等。有关更多信息，请访问ark.intel.com/content/www/us/en/ ark / products / codename / 74979 / ice-lake.html。

对新集成的四端口Thunderbolt 3控制器也是如此。Ice Lake处理器处理这些通用I / O接口中的四个，可以将Display-Port，PCI Express或USB3.1信号传送到外部图形卡和其他组件。同时允许外部电源通过USB-C电缆为笔记本电池充电。以前，Whiskey Lake需要一个外部“ Titan Ridge”芯片将DisplayPort信号转换为Thunderbolt接口信号。对于数据传输，Thunderbolt 3支持每个端口高达40Gbps的双向速率，是USB3.1的两倍。今年即将推出的新40Gbps USB4规范是基于Thunderbolt 3，并将在显示器，I / O和电源的USB-C连接器上实现标准化。

为了将所有处理器的内核，加速器和I/O控制器集成在一起，Ice Lake基于新的片上互连(“融合机箱结构”)。可扩展到更大的设计，还将出现在该公司未来的10nm台式机和服务器处理器中。Intel未公开多数细节，但是可能基于去年收购的NetSpeed公司的自动化工具来设计互连(请参阅MPR 10/1/18，“ NetSpeed Disappears Into Intel”)。

Ice Lake的其他功能出现在Intel专有EMIB(嵌入式多管芯互连桥)与处理器合封的14nm南桥chiplet上。其中一项增强功能是802.11ax(Wi-Fi 6)控制器。Intel还提供所需的外部RF芯片。以前，Whisky Lake合封Cannon Point南桥，包括速度较慢的802.11ac Wi-Fi 控制器。通过使用多种技术来增加带宽和吞吐量，在典型的2x2 MIMO无线链路上，802.11ax比802.11ac快40％。基础数据率为1.7Gbps，实际传输速率可以超过1.2Gbps。集成Wi-Fi的调制解调器可减少系统芯片数并节省电路板空间。

南桥chiplet(Intel称之为平台控制器hub)也集成向每个die供电的稳压器，进一步减少组件数量和系统成本。从前期Hub继承了四核音频DSP，16通道PCI Express控制器，3个串行ATA(SATA3)接口，6个USB3.1端口，10个USB2.0端口和1个eMMC 5.1存储卡控制器。即使笔记本盖子盖上，DSP仍可在处理器休眠时监听唤醒信息。(Intel为亚马逊Alexa和微软Cortana数字助理提供固件。)

U系列封装尺寸为50mm x 25mm，共有1,526个球。针对小型系统，Y系列封装的尺寸更小，只有26.5mm x 18.5mm，1,377个球。两者均可以放入主板凹处以减小其有效高度，使笔记本外壳更薄。

Ice Lake 滑过Ryzen

Ice Lake将与AMD Ryzen Mobile处理器竞争(请参阅MPR 1/14/19，“ Ryzen MobileRises to 12nm”)。“ Raven Ridge”芯片均为轻薄型笔记本电脑设计，但采用第一代Zen CPU，而不是增强的Zen +或即将推出的Zen 2内核，与Intel最新的第10代Sunny Cove CPU相比，起点就是缺点。处理器均采用GlobalFoundries的12nm FinFET工艺制造。

表1比较了Ryzen 3750H和最快的Ice Lake Core i7-1068G7。两者均以2.3GHz(基准)运行，且最大单核睿频几乎相同(AMD为4.0GHz，Intel为4.1GHz)。在多数方面，Ice Lake胜过对手。尽管其28W TDP是新U系列中最热的，但Ryzen在35W时的运行温度甚至更高。请注意，两个TDP都包括南桥，这是Core i7中的合封chiplet，也是Ryzen芯片上的完全集成逻辑块。i7-1068G7可增加最多55％的峰值DRAM带宽，预计CPU-intensive Cinebench R15得分会超过AMD。

表1 英特尔与AMD笔记本处理器对比 (将最快的Ice Lake U系列产品与等效的AMD Ryzen 7 移动产品进行比较。Ice Lake U系列其他芯片的基本时钟频率要低很多，标准TDP为15W。*最大单核升压频率。(来源：供应商，包括来自cpu-monkey.com的Cinebench得分，3dmark.com的3DMark得分和†Linley Group的估计值))

该文作者通过找到Whiskey Lake类似处理器的实际得分，采用调整时钟速度差异并将结果提高18％(Intel声称对Sunny Cove进行了改进)来得出Cinebench估算值。即使在Whiskey Lake中已经使用了四年的Skylake CPU也比初始Zen CPU(略)强大，因此Sunny Cove占据优势也不足为奇。额定功率有一定余地。只有实际测试才能表明哪个处理器可以更频繁地在其boost频率附近工作，这对Cinebench单核基准测试而言是一个关键差异。第三方测试人员通常会发现，Intel CPU在独立执行时会飞涨，但在所有内核都在运行时必须减慢速度以防止过热。Zen CPU的散热限制似乎较少。

在前几代中，AMD轻松胜过Intel集成GPU。Ice Lake带更强的Gen11设计，旨在扭转局面。Intel希望它能够达到或超过Raven Ridge的Vega GPU性能。到目前为止，第三方测试人员一直在使用Intel提供的“白盒”笔记本电脑，而不是零售系统，这意味着测试结果是初步的。通常，他们会进行足够的改进来证明Intel的主张合理。

作为较新的芯片设计，与Ryzen 3750H相比，Ice Lake提供了更多的DRAM带宽，集成功能和I/O。例如，Ryzen需要第三方Wi-Fi控制器来匹配Ice Lake南桥中的802.11ax调制解调器。在Ryzen的处理器芯片上集成Wi-Fi的成本很高，这就是Intel合封的原因。Core i7集成4个Thunderbolt 3接口，可以使用PCIe连接Intel Optane M.2加速器。向Ryzen添加Wi-Fi和唤醒功能需要使用外部芯片，这会增加成本并占用更多电路板空间，这是笔记本电脑设计时考虑的重要因素。

即将推出：Comet Lake

另一个比较是Core i7-1065G7与Ryzen 3700U。两者都是带集成显卡的四核八线程设计，且标称的15W TDP 相同—对于轻薄笔记本而言，这是一种更实际的配置。在这种情况下，AMD提供了更高的基本时钟频率(2.3GHz对1.3GHz)和最大睿频(4.0GHz对3.9GHz)，尽管后者不足以弥补Sunny Cove更高的IPC。3700U除了较低的TDP以外，与表中的3750H相同。至少在这场比赛中，AMD在多线程工作负载上获胜。但Ice Lake仍提供更好的单核吞吐量和其他功能。

渴望获得更多CPU性能而不是新功能的用户应该等待Intel的Comet Lake(也将于今年晚些时候推出)。这些处理器将可能集成较老的Skylake CPU内核，并且将使用14nm ++晶体管，其运行速度比较小的10nm晶体管要快(请参阅MPR 5/14/18，“ 10nm Problems Slip Ice Lake to 2019”)。泄露的信息表明，其时钟频率将比10nm Ice Lake芯片高很多，比Whiskey Lake快一点。10nm量产爬坡的任何延期都会使Comet Lake受到更多关注。

明年，Intel计划发布Ice Lake的继任者Tiger Lake。采用10nm++晶体管和Willow Cove CPU，应该比Ice Lake更快，也许与Comet Lake一样快。任何速度上的改进都会使您在更高CPU性能与更新功能之间进行选择，从而减少选择的痛苦。Intel还计划将Tiger Lake的图形性能再提高2倍，这将使其遥遥领先AMD笔记本处理器。但更大的GPU将增加制造成本，降低Intel的毛利率。 Ice Lake冷却CPU性能

经过数十年的稳步发展，令人震惊的是，业界领导者推出了新处理器，但其基本时钟频率低于其前代产品。如果只是用于降低功耗，Ice Lake的后滑将更容易接受，但标称TDP对于U系列保持不变。T系列的TDP有所增加，折中是核心更多。该公司此前曾披露，新的10nm晶体管体积较小，而不是更快，但令人震惊的是，最终的设计反映了其基础工艺的局限性。其他芯片供应商及其代工厂的时钟频率增益趋于平稳，但并没有后退。

但是，Ice Lake并未预示摩尔定律的终结，该定律描述了组件集成的进度，而不是时钟频率或CPU性能。微处理器在戈登·摩尔(Gordon Moore)1965年首次提出自己的著名规则时还没有出现)。这种进步也一直在放缓，但是并没有停止。10nm晶体管确实比其14nm晶体管小。Ice Lake通过改进Sunny Cove微体系结构以将CPU性能提高18％并集成更多功能(包括深度学习扩展)来最大程度减少了后退。对典型用户而言，相比更快的CPU，更快的图形，更大的内存带宽，更新的I / O接口和更快的Wi-Fi更有价值。更高的集成度可以将这个昂贵的项目从徒劳中解救出来，并始终忠于摩尔定律。密度不再每两年增加一倍，但仍在增加。

但是，时钟频率的下降导致Intel采取了不同寻常的步骤，即同时为同一细分市场创建两个处理器。Comet Lake将带来更高的CPU性能，而Ice Lake将提供大量新功能。如果10nm量产爬坡放缓，重叠的模型将提供备用计划。该公司可能会使用定价以使Ice Lake需求与供应相匹配。尽管如此，至少对于这一代，用户仍然必须在性能和新功能之间进行选择。

选择Ice Lake的用户将获得与其他移动产品进行竞争的处理器。AMD将其最新技术集中在高端台式PC和服务器上，使其在笔记本电脑中容易受到攻击。该公司最大的优势一直是强大的GPU，但Ice Lake的新Gen11设计否定了这一优势。尽管基本时钟频率较慢，但在仅使用一个或两个线程的应用程序中，Ice Lake仍将胜过Raven Ridge，用户将欣赏其更快的内存和集成的Wi-Fi。即使Ice Lake并非用户想要的一切，仍可以增强Intel在笔记本电脑市场中的地位。

weixin_39661405

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
浮点数例外 (核心已转储)_Ice Lake开始10 nm，新核心（译）

Ice Lake开始10 nm，新核心但较低时钟频率将减少传统性能增益Tom R. Halfhill (8月12日, 2019)Intel在处理器性能上的历史性进程终于碰壁，尽管只是10nm，但已成为一个巨大的屏障。公司采用延期很长的10nm FinFET工艺制造的第一批产品是11种“ Ice Lake”笔记本处理器，一般以更低时钟频率运行，但功耗同14nm前代产品相似。而且，Inte...
复制链接

扫一扫