多核处理器_胶水多核等于Low?处理器封装没有那么简单!

7a30b2244289ffe07703ff0a7f558a83.png

点击上方电脑爱好者关注我们

昨天CFan报道了英特尔未来将推出十六核心的第十二代酷睿处理器的消息( 详见《 8+8+1架构见过没!英特尔第十二代酷睿竟借鉴ARM? 》 )。不过,不少小伙伴都担心这次又是“胶水”多核,而且一提到“胶水”就感觉非常Low。实际上,在当前的处理器市场,胶水已经泛滥,而且它也没有我们想象的那般不堪。 632be224082139a3fbcf19c47af05302.png 源于“胶水”的多核心 现在的我们都知道,在绝大多数情况下处理器的性能与核心数量成正比,多核“吊打”单核就是天经地义。 然而,如何在1颗芯片里塞进(通过封装技术)更多核心?这个问题曾一度困扰着整个半导体行业。 将时间的指针拨回到1995年Pentium Pro的诞生前夜,受当年落后制程工艺(350nm~500nm)的拖累,别说在1颗芯片内实现双核设计,就连高速二级缓存单元都无法同时与运算核心在1颗晶圆颗粒内共存。 4f995bdda22a7ee103310be14b3c8c85.png 因此,当时英特尔的解决思路是使用2颗晶圆颗粒,分别用于制造运算核心与高速二级缓存(L2),再将它们一起封装进1块CPU的基板上,最终造出了Pentium Pro。而这种将双晶圆“胶合”在一起设计,就是“胶水双核”概念的最早来源。 b7494fce880b5697f1f9f759423e1e79.png 在未来的时间里,英特尔将“胶水”设计进一步发扬光大——先是将2个单核心整合封装的“奔腾D”(Pentium D)双核处理器,再到将2个双核心整合封装的Core 2 Quad四核处理器,“胶水”的工艺和配方不断成熟,这种“胶合”在一起的多核处理器的表现也有所改善。 d4479014fa941df6af896830aa6bf4a8.png 当然,这种由胶水粘贴出来的多核处理器依旧饱受争议,在当年曾一度掀起了“真假双核”和“真假四核”的讨论,大体结论是“真多核”性能大多领先“假多核”,以至于一提到“胶水多核”大家就一脸鄙夷。 时至今日,类似的“胶水”技术仍在处理器领域混的风生水起,只是它已经不仅限于单纯CPU运算单元,而是可以“胶合”更多模块。 “胶水”技术再度兴盛 所谓的“胶水”,主要指的就是MCM (MCM-Multichip Module,多芯片模块)技术,它能将多颗芯片和其他单元组装在同一块多层互连基板上,然后进行封装,从而形成高密度和高可靠性的微电子组件。 48ede36631bfad17a9016a3cbb3504a2.png 第一代酷睿Westmere处理器,将CPU和GPU封装在同一块基板内,它们之间使用QPI总线相连 继Pentium Pro、Pentium D和Core 2 Quad之后,英特尔还利用MCM技术先后将CPU和GPU、CPU和PCH、CPU和eDRAM缓存打包组合。 48808ee890dc68408db0368037fc40d1.png 自第二代酷睿起英特尔将内存控制器、PCI控制器、GPU全部整合进单CPU芯片后,从第四代移动版酷睿Haswell开始,英特尔又将PCH南桥芯片与CPU封装在同一块基板内 6ababdb1e9a64a8411e7cf7a84e35ebf.png 集成Iris核显的28W处理器,其中较小的芯片为eDRAM缓存 AMD也没闲着。 进入Zen架构时代之后,AMD在Ryzen锐龙及EPYC霄龙处理器上也引入了MCM技术(官方称为CCX多核架构),它们可以在一块基板上封装多个CPU Die,每个CPU Die都集成最多8核心16线程的CPU和32MB三级缓存等单元。 想拥有更多的物理核心和性能,只需搭配不同数量的CPU Die即可。 fa1b0c6fca18944a2c983ae1a7999627.png I/O die单元为14nm,CPU Die单元为10nm,同一基板上不同的Die由MCM技术胶合封装 类似的“胶水多核”还见于英特尔最新的Cascade Lake-AP 48核处理器,其本质是由两个24核的Cascade Lake处理器通过MCM技术组合而来,也并非原生48核。 虽然在历史上“胶水多核”的名声非常不好,但这项技术在今天却有着浴火重生的态势。究其原因,还是摩尔定律逐渐失效,提升频率和增加核心之路变得越发艰难。 理论上讲,将CPU、GPU、缓存、I/O等控制器打包到同一块晶圆芯片上(单片电路)最是完美,但在半导体工艺逐渐逼近物理极限的情况下,既想要更多核心,还要更高主频,集成包括CPU、PCH、I/O单元、DDR内存控制器、PCIe控制器和IF控制器在内的所有常见功能模块,成本还不能太高——纯属做梦! 2216a416ca7ffa6a85d387410796ba41.png 因此。在现有工艺的水平上,最经济可行的解决方案,唯有异构MCM之路。 然而,处理器基板的面积有限,表面多颗芯片之间的通讯还存在延迟的隐患,这就需要处理器厂商优化封装技术,并引入更高速的总线接口。 封装技术的立体演进 想将不同功能模块单元胶合在同一块基板上看起来很容易,但现实情况却是困难重重。 09654bd1c11073f26aa85eded9c6e79c.png 比如,不是所有功能模块都需要最先进的工艺,CPU和GPU用7nm,内存控制器14nm就足够了,想将这些不同工艺的芯片融合在一起,还要降低成本和保证良品率,这可不是传统2D封装技术能搞定的,于是就有了2.5D封装技术。 在2.5D封装技术上,知名的方案主要以台积电的“InFO”(整合型扇出)和英特尔“EMIB”(嵌入式多芯片互连桥接)为主,前者能以较低成本的有机封装来链接芯片,但在密度上不如EMIB。 此外。AMD曾在Fury X显卡首次商业化的HBM显存技术、新一代锐龙处理器7nm CPU Die和14nm I/O Die单元分离的设计,也是利用了2.5D封装将GPU核心与HBM核心整合在一个底座上。 38eaad83328c9405c3ed6110fe99b941.png 我们可以将以英特尔EMIB为代表的2.5D封装技术理解为“平面版”的乐高积木,可以在一个固定大小的平面上,横向固定不同样式和大小的积木块。 在处理器领域,这些积木块就变成了由不同工艺打造的不同功能模块,比如将7nm工艺的CPU、10nm的GPU、14nm的I/O单元、22nm的通讯单元等等。 EMIB的意义就在于能将不同制程的芯片组合在同一基板的封装之中,同时它还具有正常的封装良品率、不需要额外的工艺、设计简单等优点。 65226f4766aeea8740e58fead6f11a48.png 英特尔和AMD携手打造的“Kaby Lake-G”平台处理器(整合CoffeeLake-H架构的CPU、AMD Vega架构的GPU以及4GB HBM2显存)以及Stratix 10 FPGA就是EMIB技术的首次预演。 问题来了,2.5D封装技术可以容纳多少功能模块取决于基板大小,对于绝大多数处理器的芯片尺寸而言,空间总是不够用的。 此时,就需要一种类似“立体版”的乐高积木了,可以像盖楼一般将所有需要的功能模块一层层地纵向叠加累积起来。 引领未来的3D封装技术 提起芯片的堆叠,可能很多朋友都会想到智能手机——几乎所有的新款手机都会选择将内存芯片覆盖在处理器芯片上以节省主板空间,叠放还能让处理器和内存间的引线长度最短,从而降低线路噪音、访问延迟、电力损耗。手机领域的这种内存和处理器“叠罗汉”的设计即PoP(元件堆叠装配),它并非3D封装,而是“堆叠”,属于一种多成品芯片之间的焊接技术。 f3f89868edee257e6521d4fec6f5b91a.png 真正的“3D封装”,应该是一种晶圆对晶圆(Wafer-On-Wafer)无凸起的键合(Bonding)3D IC制程技术。目前符合这一标准的技术,主要以台积电旗下的“SoIC”,以及英特尔主推的“Foveros”的3D封装技术为主。 ae2d690a29cd147d3af6edea0967331d.png 先来看看台积电的SoIC技术,它是基于CoWoS与多晶圆堆叠技术开发的新一代创新封装技术,利用硅穿孔(TSV)技术将多种不同性质的临近芯片整合在一起,用于结合的机密材料(号称价值十亿美元)能直接透过微小的孔隙沟通多层的芯片,在减少厚度的同时还能增加多倍以上的性能。 英特尔的Foveros技术的原理是通过TSV和微凸块(Micro-Bumps)技术,堆叠其他的晶圆芯片和微芯片。 它可以让只能在EMIB封装技术中以平面分布的功能模块纵向立体的摞在一起,在牺牲一点点厚度的前提下就可进一步压缩处理器基板的尺寸。 1eab63cf8c00136c1f66b00d840b9774.png 以英特尔Lakefield处理器为例,它在12mm×12mm的面积里就集成了1个10nm制程的Sunny Cove架构CPU大核、4个10nm制程的Tremont架构CPU小核、以及LPDDR4内存控制器、L2和L3缓存以及Gen11 GPU单元。 522d5f052dd0e0462974c423fd392c81.png Lakefield处理器和主板与签字笔的大小对比 作为目前最高级的“胶水”,3D封装技术能在更小尺寸的芯片里就整合更多的功能模块。 然而,在制程工艺已逼近物理极限,异构计算大行其道,更多不同类型的芯片需要被集成在一起的大环境下,无论SoIC还是Foveros似乎都还有所不足。 为了实现基于封装技术,就能在更小尺寸的基板上打造出集成多类型小芯片的SoC系统级单芯片的梦想,英特尔祭出了“终极胶水”——将2.5D封装EMIB和3D封装Foveros技术优势集于一身的“Co-EMIB”方案,它能在将多芯片横向拼接的同时,还能在任意芯片的表面继续叠高楼,并通过全方位互连(ODI)技术、裸片间接口(MDIO)技术和硅通孔(TSV)技术解决多芯片矩阵之间互联通讯和延迟等问题。 8d44e0d504a0085ac8233cbd092c70a5.png 值得一提的是,AMD在推出HBM显存产品,实现了GPU芯片和显存芯片的2.5D整合封装后,也即将跟进3D封装技术,初级目标是将DRAM/SRAM和处理器(CPU/GPU)通过TSV(硅穿孔)的方式整合在一颗芯片中,虽然形式上与手机领域的PoP封装处理器+内存颗粒相似,但底层技术却更加先进。 总之,在异构计算时代,“胶水多核”已经不再是招人嘲笑的对象,而是一种符合历史发展潮流的必然选择。只是,借助封装技术将更多芯片灵活的“打包”后,需要面临更为严苛的散热问题,开发人员需要更加精心地考虑系统的结构(甚至影响系统的物理结构和芯片的核心架构),以适应、调整各个热点。 看 了这篇文章,大家还会点击:

edf7ff2274e94043004376be7f177b49.png

3154a70508249f44ba39320c8f09fa7b.png

点击“阅读原文”查看更多精彩

深度学习是机器学习的一个子领域,它基于人工神经网络的研究,特别是利用多层次的神经网络来进行学习和模式识别。深度学习模型能够学习数据的高层次特征,这些特征对于图像和语音识别、自然语言处理、医学图像分析等应用至关重要。以下是深度学习的一些关键概念和组成部分: 1. **神经网络(Neural Networks)**:深度学习的基础是人工神经网络,它是由多个层组成的网络结构,包括输入层、隐藏层和输出层。每个层由多个神经元组成,神经元之间通过权重连接。 2. **前馈神经网络(Feedforward Neural Networks)**:这是最常见的神经网络类型,信息从输入层流向隐藏层,最终到达输出层。 3. **卷积神经网络(Convolutional Neural Networks, CNNs)**:这种网络特别适合处理具有网格结构的数据,如图像。它们使用卷积层来提取图像的特征。 4. **循环神经网络(Recurrent Neural Networks, RNNs)**:这种网络能够处理序列数据,如时间序列或自然语言,因为它们具有记忆功能,能够捕捉数据中的时间依赖性。 5. **长短期记忆网络(Long Short-Term Memory, LSTM)**:LSTM 是一种特殊的 RNN,它能够学习长期依赖关系,非常适合复杂的序列预测任务。 6. **生成对抗网络(Generative Adversarial Networks, GANs)**:由两个网络组成,一个生成器和一个判别器,它们相互竞争,生成器生成数据,判别器评估数据的真实性。 7. **深度学习框架**:如 TensorFlow、Keras、PyTorch 等,这些框架提供了构建、训练和部署深度学习模型的工具和库。 8. **激活函数(Activation Functions)**:如 ReLU、Sigmoid、Tanh 等,它们在神经网络中用于添加非线性,使得网络能够学习复杂的函数。 9. **损失函数(Loss Functions)**:用于评估模型的预测与真实值之间的差异,常见的损失函数包括均方误差(MSE)、交叉熵(Cross-Entropy)等。 10. **优化算法(Optimization Algorithms)**:如梯度下降(Gradient Descent)、随机梯度下降(SGD)、Adam 等,用于更新网络权重,以最小化损失函数。 11. **正则化(Regularization)**:技术如 Dropout、L1/L2 正则化等,用于防止模型过拟合。 12. **迁移学习(Transfer Learning)**:利用在一个任务上训练好的模型来提高另一个相关任务的性能。 深度学习在许多领域都取得了显著的成就,但它也面临着一些挑战,如对大量数据的依赖、模型的解释性差、计算资源消耗大等。研究人员正在不断探索新的方法来解决这些问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值