浮点数例外 (核心已转储)_Ice Lake开始10 nm,新核心(译)

Ice Lake开始10 nm,新核心 但较低时钟频率将减少传统性能增益 Tom R. Halfhill (8月12日, 2019)  

Intel在处理器性能上的历史性进程终于碰壁,尽管只是10nm,但已成为一个巨大的屏障。公司采用延期很长的10nm FinFET工艺制造的第一批产品是11种“ Ice Lake”笔记本处理器,一般以更低时钟频率运行,但功耗同14nm前代产品相似。而且,Intel第10代“ Sunny Cove” CPU也无法克服时钟频率下滑的问题。幸运的是,新芯片提供了更快的图形加速器,更大的内存带宽以及其他可能对典型用户更重要的功能。另外,某些型号具有更多的CPU内核。

10nm晶体管比现有14nm晶体管慢,但更小,支持在处理器die上实现更高集成度。受益者是更大的Gen11 GPU,Intel表示,10nm上,比前一代集成显卡快约2倍。另一个受益者是业界第一款集成的Thunderbolt 3控制器。如图1所示,合封14nm南桥chiplet,集成更多新功能,包括1个802.11ax(Wi-Fi 6)控制器以及2个用于处理器和合封chiplet的稳压器。总之,用户可以欣赏10nm工艺Ice Lake所带来的新优势,即使是在质疑其逆向CPU频率和能效的同时。

 

979c26e8436893716800c1770edfd78e.png

图1 Ice Lake框图 (新处理器最多集成4个CPU核心,单内核集成2MB L3 Cache。同时集成了比前一代产品大得多的GPU以及新的Thunder-bolt控制器。新合封南桥(PCH)增加了稳压器,支持处理器及PCH chiplet自身。)  

作为Intel第10代核心处理器的第一个系列,Ice Lake推出了新的产品编号方案,增加了G后缀以指定图形功能。Ice Lake型号属于公司的U系列和Y系列,分别取代第8代Whiskey Lake和Amber Lake。U系列稳定保持15W的热设计功率(TDP),面向轻薄型笔记本电脑。Y系列TDP上升到9W,以2合1或带键盘的平板电脑为目标。Ice Lake已经投入量产,Intel预计系统将在今年年前上架。第10代的另一个家族,代号为Comet Lake,将在同一时间针对相同类型的系统首次亮相。

这些新处理器支持Intel的Athena项目,该项目在移动PC中推广新技术。该公司在2011年凭借“ Ultrabook”参考设计率先推出超薄Windows PC,与此同时,它也希望再次改善用户体验。Athena项目推广了新功能,如即时开机,语音激活,延长电池寿命,设备内AI服务以及改进的无线连接。Acer,华硕,戴尔,谷歌,惠普,联想,微软,三星和夏普都计划部署兼容Athena的产品,首批产品将于今年上市。

  基本时钟频率下降  

除了一个例外,如图2所示,尽管内核数相同,但Ice Lake U系列芯片的基本时钟频率比其Whiskey Lake前代产品低得多。Core i7-1068G7例外,它将最快的基本时钟微调至2.3GHz,而将最快的Whiskey Lake(Core i3-8145U)微调至2.1GHz。但是,新芯片核心和线程数是原来两倍,取代同样配备的Core i7-8665U。后者在标称15W TDP时的基本时钟频率为1.9GHz,但在25W“可配置” TDP时的基本时钟升至2.1GHz。(较高的额定值适用于可以承受更高热量的系统;芯片可以更接近其最大升压频率运行)。因此,在类似功耗水平下,新的四核1068G7比四核8665U快约10%( 28W和25W)。但是,其他Ice Lake U系列芯片的基频比其Whiskey Lake前代低得多。

   

ca518627790e7225716271138719b983.png

图2 Ice Lake与第八代笔记本处理器比较 (Ice Lake采用新的“ Sunny Cove”第十代Core CPU和Gen11集成显卡。该图表显示了核心数量,TDP,基频/睿频以及1,000-unit起订的单价。*“可配置TDP-up”规格。(来源:Intel,除了†,Linley Group评估))  

更大修改是Ice Lake Y系列。部分基本时钟频率下降50%以上。Y系列其中两款基本频率低于1.0GHz,甚至到了多年未见的兆赫兹。但是,Y系列标称的TDP上升到9W,而前一代Amber Lake的TDP则为5W或7W。原因是Y系列多数芯片都是四核,而所有的Amber Lake芯片都只有双核。对于这些型号,Ice Lake将较低的基本时钟换取更多内核和较高TDP。但是,由于它们的睿频下滑速度不及基本速度,因此当只有两个内核运行时,它们仍然非常快。

 

Intel在U系列中共发布6款处理器,Y系列5款处理器。Core i3/i5 /i7品牌保持不变,但更改了产品编号。为了兼容新一代数字,前两位数字始终为10,仅剩下两位数字来表示相对性能。与前几代产品不同,最后三位数字与前几位完全不同(请参阅MPR 9/3/18,“Intel Pours Whiskey Lake for Laptops”)。

Intel还删除了产品编号末尾的系列名称(如U或Y)。该公司仍使用传统名称来称呼该系列,并且产品编号的最后一位数字现在对应于该系列(Y系列为0,U系列为5)。新的G1/G4 /G7后缀表示集成GPU的大小-数字越大,执行单位(EU)越多。拥有48个或64个EU的最大GPU称为 Iris Plus品牌,该品牌以前是为集成额外64MB嵌入式DRAM的产品保留的。

所有处理器供应商的时钟频率进程都已放缓,无论采用哪种IC工艺。但是Ice Lake是Intel第一个倒退,没有以时钟频率换取较低功耗。相对该公司花了四年时间研发的14nm晶体管而言,较小的晶体管速度反而较慢。考虑到公司将该工艺推向市场的另外四年的昂贵开发代价,能否降低成本也令人怀疑。但对多数人来说,PC已经足够快。该文作者相信,典型用户将从更快的集成显卡,更快的I/O接口,更快的内存和更快的Wi-Fi连接中获得更多价值。Ice Lake实现了所有这些目标。

    Sunny Cove的灿烂日出  

Sunny Cove是Intel四年来首款具有乱序功能的新型CPU。第10代核心架构为位处理,内存分页,加密和其他与安全性相关的操作添加了九个指令集扩展(请参阅MPR 2/4/19,“Intel’s Sunny Cove Sits on an Icy Lake”)。其中一些首次出现在2018年的Core i3-8121U(Cannon Lake)中,但很少出现在实际发售的10nm量产器件之中(见MPR 6/11/18,“ Cannon Lake Misfires”)。

尽管位操作和加密扩展可能会为笔记本电脑用户带来部分好处,但其他功能主要针对服务器。例如,内存分页扩展到五个级别,将虚拟地址空间增加到131,072 TB,将物理地址空间增加到4,096 TB。而且,MK-TME扩展可以加密外部存储器中的数据,这是在管理程序上托管多个虚拟机的服务器中的一项有用功能。

Sunny Cove中还新增了VNNI扩展,Intel将其称为DL Boost。这些指令可加速采用8位整数(INT8)数据的AI推理算法。它们首先在Cascade Lake服务器处理器中使用,将乘累加吞吐量提高3倍(请参阅MPR 9/3/18,“ Cascade Lake Speeds Deep Learning”)。尽管应用程序性能无法实现这一目标,但该公司已使用INT8数据将ResNet-50深度学习模型的速度提高了2.5倍。

相比Skylake CPU,Sunny Cove扩大了L1数据Cache(48KB与32KB),L2 Cache(512KB与256KB),L2转换旁路缓冲区(2,048个条目与1,536个),微操作Cache(2,250个操作与 1,500),乱序执行窗口(352条指令与224条指令),最大in-flight load指令数(128条与72条)以及最大in-flight store指令数(72条与56条)。这些都是重大改进。

因此,Intel声称Sunny Cove CPU单周期(IPC)指令执行量比Skylake CPU多18%。尽管对于已经强大的微体系结构而言,这一成就令人钦佩,但对比Ice Lake和Whiskey Lake处理器时,依然无法抵消基本时钟频率下降带来的影响。在执行新扩展的大工作负载时,Ice Lake具有更大潜力。例如,Intel声称DL Boost的峰值推理吞吐量比“其他同类产品”高8.8倍,这显然是针对未加速的AMD处理器的比较。但是,在主流PC工作负载上,Ice Lake的IPC增长18%可能无法弥补其更大的时钟频率下降的问题。

  追赶AMD图形能力  

不过,Ice Lake似乎更快,因为其Gen11的集成GPU超越了前一代Intel处理器。尤其值得一提的是,在该公司看来,通过集成64个着色器内核或执行单元,排名前三的U系列芯片和前两个Y系列芯片脱颖而出,而Whiskey Lake的Gen9 GPU只有24个。甚至低端G1型号也有32个EU。Gen11的最大时钟频率从900MHz到1.1GHz,大约与以前相同,因此额外的EU有效提高了性能。最大情况下,最快的Gen11 GPU提供了1.12Tflop / s的单精度浮点吞吐量或2.25Tflop / s的半精度吞吐量-至少比Gen9高2倍(请参阅MPR 1/21/19,“Intel Turns Graphics up to (Gen) 11”)。

有了这种巨大的提升,新GPU首次达到AMD集成GPU的性能,并且与入门级图形卡相似。Intel的基准测试结果表明,在某些游戏和一些3DMark测试中,Ice Lake的最佳图形能力稍胜于Ryzen 7图形能力,尽管在某些情况下,它们的速度要慢一些。该公司的类似基准测试表明,在某些游戏中,《Ice Lake》的帧率比Whiskey Lake高80%。该文作者希望独立的基准测试能够大致确认这些说法。从历史上看,Intel的图形能力已经落后于AMD的图形处理能力,因此即使实现等效也是一个里程碑。

为了辅助更快的GPU,Ice Lake升级了媒体加速器,实际是GPU复合体的一部分。两个增强型视频引擎可以以高达60fps(10位彩色,4:4:4采样频率)的帧速率编码4K分辨率视频,或以30fps(10位彩色,4:2:0)的8K视频编码。Intel表示,它们比以前的编码器快2倍。新的图像处理单元可以处理16兆像素的图像,30fps的4K视频或120fps的1080p视频。

与以前型号类似,Ice Lake可以通过DisplayPort 1.4或HDMI 2.0b接口同时驱动三个显示器,显示分辨率为60fps时5K或120fps时4K。这些功能使在Ice Lake瞄准的轻薄笔记本电脑上进行随意视频编辑成为可能,但是重任务仍需工作站级的笔记本电脑或台式PC。

  更快解决问题  

更快的内存控制器和I/O接口还可以协助Ice Lake补偿其较慢的CPU。双通道64位DRAM控制器可与多达64GB的DDR4-3200内存(在两个64位通道中)或高达32GB的LPDDR4X-3733内存(在四个16位通道中)一起工作。峰值DRAM带宽分别为51.2GB / s或59.7GB / s。相比,Whiskey Lake仅限于DDR4-2400或LPDDR3-2133内存,提供的峰值DRAM带宽不超过38.4GB / s。由于内存通常是当今系统的瓶颈,因此Ice Lake的改进(高达56%),可以实现机器在人的感觉上更快。

 
价格和供货情况Intel U系列和Y系列处理器(Ice Lake)于今年夏天开始发货。该公司预计,今年年底之前将有超过35种系统首次亮相。某些产品暂未提供报价;如图2所示,预计价格从300美元到426美元不等。有关更多信息,请访问ark.intel.com/content/www/us/en/ ark /  products / codename / 74979 / ice-lake.html。
 

对新集成的四端口Thunderbolt 3控制器也是如此。Ice Lake处理器处理这些通用I / O接口中的四个,可以将Display-Port,PCI Express或USB3.1信号传送到外部图形卡和其他组件。同时允许外部电源通过USB-C电缆为笔记本电池充电。以前,Whiskey Lake需要一个外部“ Titan Ridge”芯片将DisplayPort信号转换为Thunderbolt接口信号。对于数据传输,Thunderbolt 3支持每个端口高达40Gbps的双向速率,是USB3.1的两倍。今年即将推出的新40Gbps USB4规范是基于Thunderbolt 3,并将在显示器,I / O和电源的USB-C连接器上实现标准化。

为了将所有处理器的内核,加速器和I/O控制器集成在一起,Ice Lake基于新的片上互连(“融合机箱结构”)。可扩展到更大的设计,还将出现在该公司未来的10nm台式机和服务器处理器中。Intel未公开多数细节,但是可能基于去年收购的NetSpeed公司的自动化工具来设计互连(请参阅MPR 10/1/18,“ NetSpeed Disappears Into Intel”)。

Ice Lake的其他功能出现在Intel专有EMIB(嵌入式多管芯互连桥)与处理器合封的14nm南桥chiplet上。其中一项增强功能是802.11ax(Wi-Fi 6)控制器。Intel还提供所需的外部RF芯片。以前,Whisky Lake合封Cannon Point南桥,包括速度较慢的802.11ac Wi-Fi 控制器。通过使用多种技术来增加带宽和吞吐量,在典型的2x2 MIMO无线链路上,802.11ax比802.11ac快40%。基础数据率为1.7Gbps,实际传输速率可以超过1.2Gbps。集成Wi-Fi的调制解调器可减少系统芯片数并节省电路板空间。

南桥chiplet(Intel称之为平台控制器hub)也集成向每个die供电的稳压器,进一步减少组件数量和系统成本。从前期Hub继承了四核音频DSP,16通道PCI Express控制器,3个串行ATA(SATA3)接口,6个USB3.1端口,10个USB2.0端口和1个eMMC 5.1存储卡控制器。即使笔记本盖子盖上,DSP仍可在处理器休眠时监听唤醒信息。(Intel为亚马逊Alexa和微软Cortana数字助理提供固件。)

U系列封装尺寸为50mm x 25mm,共有1,526个球。针对小型系统,Y系列封装的尺寸更小,只有26.5mm x 18.5mm,1,377个球。两者均可以放入主板凹处以减小其有效高度,使笔记本外壳更薄。

  Ice Lake 滑过Ryzen  

Ice Lake将与AMD Ryzen Mobile处理器竞争(请参阅MPR 1/14/19,“ Ryzen MobileRises to 12nm”)。“ Raven Ridge”芯片均为轻薄型笔记本电脑设计,但采用第一代Zen CPU,而不是增强的Zen +或即将推出的Zen 2内核,与Intel最新的第10代Sunny Cove CPU相比,起点就是缺点。处理器均采用GlobalFoundries的12nm FinFET工艺制造。

表1比较了Ryzen 3750H和最快的Ice Lake Core i7-1068G7。两者均以2.3GHz(基准)运行,且最大单核睿频几乎相同(AMD为4.0GHz,Intel为4.1GHz)。在多数方面,Ice Lake胜过对手。尽管其28W TDP是新U系列中最热的,但Ryzen在35W时的运行温度甚至更高。请注意,两个TDP都包括南桥,这是Core i7中的合封chiplet,也是Ryzen芯片上的完全集成逻辑块。i7-1068G7可增加最多55%的峰值DRAM带宽,预计CPU-intensive Cinebench R15得分会超过AMD。

82444d0f564a9a5500bccc6a17eb5603.png

表1 英特尔与AMD笔记本处理器对比 (将最快的Ice Lake U系列产品与等效的AMD Ryzen 7 移动产品进行比较。Ice Lake U系列其他芯片的基本时钟频率要低很多,标准TDP为15W。*最大单核升压频率。(来源:供应商,包括来自cpu-monkey.com的Cinebench得分,3dmark.com的3DMark得分和†Linley Group的估计值))  

该文作者通过找到Whiskey Lake类似处理器的实际得分,采用调整时钟速度差异并将结果提高18%(Intel声称对Sunny Cove进行了改进)来得出Cinebench估算值。即使在Whiskey Lake中已经使用了四年的Skylake CPU也比初始Zen CPU(略)强大,因此Sunny Cove占据优势也不足为奇。额定功率有一定余地。只有实际测试才能表明哪个处理器可以更频繁地在其boost频率附近工作,这对Cinebench单核基准测试而言是一个关键差异。第三方测试人员通常会发现,Intel CPU在独立执行时会飞涨,但在所有内核都在运行时必须减慢速度以防止过热。Zen CPU的散热限制似乎较少。

在前几代中,AMD轻松胜过Intel集成GPU。Ice Lake带更强的Gen11设计,旨在扭转局面。Intel希望它能够达到或超过Raven Ridge的Vega GPU性能。到目前为止,第三方测试人员一直在使用Intel提供的“白盒”笔记本电脑,而不是零售系统,这意味着测试结果是初步的。通常,他们会进行足够的改进来证明Intel的主张合理。

作为较新的芯片设计,与Ryzen 3750H相比,Ice Lake提供了更多的DRAM带宽,集成功能和I/O。例如,Ryzen需要第三方Wi-Fi控制器来匹配Ice Lake南桥中的802.11ax调制解调器。在Ryzen的处理器芯片上集成Wi-Fi的成本很高,这就是Intel合封的原因。Core i7集成4个Thunderbolt 3接口,可以使用PCIe连接Intel Optane M.2加速器。向Ryzen添加Wi-Fi和唤醒功能需要使用外部芯片,这会增加成本并占用更多电路板空间,这是笔记本电脑设计时考虑的重要因素。

  即将推出:Comet Lake  

另一个比较是Core i7-1065G7与Ryzen 3700U。两者都是带集成显卡的四核八线程设计,且标称的15W TDP 相同—对于轻薄笔记本而言,这是一种更实际的配置。在这种情况下,AMD提供了更高的基本时钟频率(2.3GHz对1.3GHz)和最大睿频(4.0GHz对3.9GHz),尽管后者不足以弥补Sunny Cove更高的IPC。3700U除了较低的TDP以外,与表中的3750H相同。至少在这场比赛中,AMD在多线程工作负载上获胜。但Ice Lake仍提供更好的单核吞吐量和其他功能。

 

渴望获得更多CPU性能而不是新功能的用户应该等待Intel的Comet Lake(也将于今年晚些时候推出)。这些处理器将可能集成较老的Skylake CPU内核,并且将使用14nm ++晶体管,其运行速度比较小的10nm晶体管要快(请参阅MPR 5/14/18,“ 10nm Problems Slip Ice Lake to 2019”)。泄露的信息表明,其时钟频率将比10nm Ice Lake芯片高很多,比Whiskey Lake快一点。10nm量产爬坡的任何延期都会使Comet Lake受到更多关注。

明年,Intel计划发布Ice Lake的继任者Tiger Lake。采用10nm++晶体管和Willow Cove CPU,应该比Ice Lake更快,也许与Comet Lake一样快。任何速度上的改进都会使您在更高CPU性能与更新功能之间进行选择,从而减少选择的痛苦。Intel还计划将Tiger Lake的图形性能再提高2倍,这将使其遥遥领先AMD笔记本处理器。但更大的GPU将增加制造成本,降低Intel的毛利率。     Ice Lake冷却CPU性能  

经过数十年的稳步发展,令人震惊的是,业界领导者推出了新处理器,但其基本时钟频率低于其前代产品。如果只是用于降低功耗,Ice Lake的后滑将更容易接受,但标称TDP对于U系列保持不变。T系列的TDP有所增加,折中是核心更多。该公司此前曾披露,新的10nm晶体管体积较小,而不是更快,但令人震惊的是,最终的设计反映了其基础工艺的局限性。其他芯片供应商及其代工厂的时钟频率增益趋于平稳,但并没有后退。

但是,Ice Lake并未预示摩尔定律的终结,该定律描述了组件集成的进度,而不是时钟频率或CPU性能。微处理器在戈登·摩尔(Gordon Moore)1965年首次提出自己的著名规则时还没有出现)。这种进步也一直在放缓,但是并没有停止。10nm晶体管确实比其14nm晶体管小。Ice Lake通过改进Sunny Cove微体系结构以将CPU性能提高18%并集成更多功能(包括深度学习扩展)来最大程度减少了后退。对典型用户而言,相比更快的CPU,更快的图形,更大的内存带宽,更新的I / O接口和更快的Wi-Fi更有价值。更高的集成度可以将这个昂贵的项目从徒劳中解救出来,并始终忠于摩尔定律。密度不再每两年增加一倍,但仍在增加。

但是,时钟频率的下降导致Intel采取了不同寻常的步骤,即同时为同一细分市场创建两个处理器。Comet Lake将带来更高的CPU性能,而Ice Lake将提供大量新功能。如果10nm量产爬坡放缓,重叠的模型将提供备用计划。该公司可能会使用定价以使Ice Lake需求与供应相匹配。尽管如此,至少对于这一代,用户仍然必须在性能和新功能之间进行选择。

选择Ice Lake的用户将获得与其他移动产品进行竞争的处理器。AMD将其最新技术集中在高端台式PC和服务器上,使其在笔记本电脑中容易受到攻击。该公司最大的优势一直是强大的GPU,但Ice Lake的新Gen11设计否定了这一优势。尽管基本时钟频率较慢,但在仅使用一个或两个线程的应用程序中,Ice Lake仍将胜过Raven Ridge,用户将欣赏其更快的内存和集成的Wi-Fi。即使Ice Lake并非用户想要的一切,仍可以增强Intel在笔记本电脑市场中的地位。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值