目录
一 先认识 chipset
1.1. chipset什么意思?
芯片组 (Chipset)是主板的核心组成部分,如果说中央处理器(CPU)是整个电脑系统的心脏,那么芯片组将是整个身体的躯干。可以理解为,chipset 是主板上除去CPU 之外的所有芯片的集合。它是一个芯片集合的代号。
在电脑界称设计芯片组的厂家为Core Logic,Core的中文意义是核心或中心,光从字面的意义就足以看出其重要性。对于主板而言,芯片组几乎决定了这块主板的功能,进而影响到整个电脑系统性能的发挥,芯片组是主板的灵魂。芯片组性能的优劣,决定了主板性能的好坏与级别的高低。这是因为目前CPU的型号与种类繁多、功能特点不一,如果芯片组不能与CPU良好地协同工作,将严重地影响计算机的整体性能甚至不能正常工作。
1.2. chipset 驱动的作用
主板芯片组驱动在这种沟通中起着至关重要的任用,它主要用来开启主板芯片组内置功能与特性,主板驱动里一般是主板识别管理各种周边设备驱动程序或补丁。
1.3. chipset 驱动是什么
就是主板驱动程序,驱动程序的定义:是一种可以使计算机和设备通信的特殊程序,可以 说相当于硬件的接口,操作系统只有通过这个接口,才能控制硬件设备的工作,假如某设备的驱动程序未能正确安装,便不能正常工作。 因此,驱动程序被誉为“ 硬件的灵魂”、“硬件的主宰”、和“硬件和系统之间的桥梁”等。
1.4. chipset 举例
下面以英伟达-NFORCE4-A939 芯片组为例,看看具体有什么内容。
指标解释:
(1)集成芯片:是指主板所整合了显卡,声卡或者网卡
(2)主芯片组:
北桥芯片(North Bridge)是主板芯片组中起主导作用的最重要的组成部分,也称为主桥(Host Bridge)。一般来说,芯片组的名称就是以北桥芯片的名称来命名的,例如英特尔 845E芯片组的北桥芯片是82845E,875P芯片组的北桥芯片是82875P等等。
北桥芯片负责与CPU的联系并控制内存、AGP、PCI数据在北桥内部传输,提供对CPU的类型和主频、系统的前端总线频率、内存的类型(SDRAM,DDR SDRAM以及RDRAM等等)和最大容量、ISA/PCI/AGP插槽、ECC纠错等支持,整合型芯片组的北桥芯片还集成了显示核心。
北桥芯片就是主板上离CPU最近的芯片,这主要是考虑到北桥芯片与处理器之间的通信最密切,为了提高通信性能而缩短传输距离。因为北桥芯片的数据处理量非常大,发热量也越来越大,所以现在的北桥芯片都覆盖着散热片用来加强北桥芯片的散热,有些主板的北桥芯片还会配合风扇进行散热。因为北桥芯片的主要功能是控制内存,而内存标准与处理器一样变化比较频繁,所以不同芯片组中北桥芯片是肯定不同的,当然这并不是说所采用的内存技术就完全不一样,而是不同的芯片组北桥芯片间肯定在一些地方有差别。
南桥芯片和北桥芯片区别
北桥芯片
一个主板上最重要的部分可以说就是主板的芯片组了,主板的芯片组一般由北桥芯片和南桥芯片组成,两者共同组成主板的芯片组。北桥芯片主要负责实现与CPU、内存、AGP接口之间的数据传输,同时还通过特定的数据通道和南桥芯片相连接。北桥芯片的封装模式最初使用BGA封装模式,到现在Intel的北桥芯片已经转变为FC-PGA封装模式,不过为AMD处理器设计的主板北桥芯片到现在依然还使用传统的BGA封装模式。
南桥芯片
相比北桥芯片来讲,南桥芯片主要负责和IDE设备、PCI设备、声音设备、网络设备以及其他的I/O设备的沟通,南桥芯片到目前为止还只能见到传统的BGA封装模式一种。另外,除了传统的南北桥芯片的分类方法外,现在还能够见到一体化的设计方案,这种方案经常在SiS的芯片组上见到,将南北桥芯片合为一块芯片,这种设计方案有着独到之处,不过到目前还没有广泛的推广开来。
1.5. chipset 发展
到2019年为止,能够生产芯片组的厂家有英特尔(美国)、VIA(中国台湾)、SiS(中国台湾)、ULI(中国台湾)、AMD(美国)、NVIDIA(美国)、ATI(加拿大)、ServerWorks(美国)、IBM(美国)、HP(美国)等为数不多的几家,其中以英特尔和NVIDIA以及VIA的芯片组最为常见。在台式机的英特尔平台上,英特尔自家的芯片组占有最大的市场份额,而且产品线齐全,高、中、低端以及整合型产品都有,其它的芯片组厂商VIA、SIS、ULI以及最新加入的ATI和NVIDIA几家加起来都只能占有比较小的市场份额。
除NVIDIA之外的其它厂家主要是在中低端和整合领域,NVIDIA则只具有中、高端产品,缺乏低端产品,产品线都不完整。在AMD平台上,AMD自身通常是扮演一个开路先锋的角色,产品少,市场份额也很小,而VIA以前却占有AMD平台芯片组最大的市场份额。
但现在却受到后起之秀NVIDIA的强劲挑战,后者凭借其nForce2、nForce3以及现在的nForce4系列芯片组的强大性能,成为AMD平台最优秀的芯片组产品,进而从VIA手里夺得了许多市场份额,目前已经成为AMD平台上市场占用率最大的芯片组厂商。
而SIS与ULI依旧是扮演配角,主要也是在中、低端和整合领域。笔记本方面,英特尔平台具有绝对的优势,所以英特尔自家的笔记本芯片组也占据了最大的市场分额,其它厂家都只能扮演配角以及为市场份额极小的AMD平台设计产品。
服务器/工作站方面,英特尔平台更是绝对的优势地位,英特尔自家的服务器/工作站芯片组产品占据着绝大多数的市场份额,但在基于英特尔架构的高端多路服务器领域方面,IBM和HP却具有绝对的优势,例如IBM的XA32以及HP的F8都是非常优秀的高端多路服务器芯片组产品。
只不过都是只应用在本公司的服务器产品上而名声不是太大罢了;而AMD服务器/工作站平台由于市场份额较小,以前主要都是采用AMD自家的芯片组产品,现在也有部分开始采用NVIDIA的产品。
值得注意的是,曾经在基于英特尔架构的服务器/工作站芯片组领域风光无限的ServerWorks在被Broadcom收购之后已经彻底退出了芯片组市场;而ULI也已经被NVIDIA收购,也极有可能退出芯片组市场。
芯片组的技术这几年来也是突飞猛进,从ISA、PCI、AGP到PCI-Express,从ATA到SATA,Ultra DMA技术,双通道内存技术,高速前端总线等等 ,每一次新技术的进步都带来电脑性能的提高。2004年,芯片组技术又会面临重大变革,最引人注目的就是PCI Express总线技术。
它将取代PCI和AGP,极大的提高设备带宽,从而带来一场电脑技术的革命。另一方面,芯片组技术也在向着高整合性方向发展,例如AMD Athlon 64 CPU内部已经整合了内存控制器。
这大大降低了芯片组厂家设计产品的难度,而且现在的芯片组产品已经整合了音频,网络,SATA,RAID等功能,大大降低了用户的成本。
二、再认识chiplet
Chiplet,中文译为“芯粒”或“小芯片”。
从 DARPA 的 CHIPS 项目到 Intel 的 Foveros,都把 chiplet 看成是未来芯片的重要基础技术。
简单来说,chiplet 技术就是像搭积木一样,把一些预先生产好的实现特定功能的芯片裸片(die)通过先进的集成技术(比如 3D integraTIon)集成封装在一起形成一个系统芯片。而这些基本的裸片就是 chiplet。
从这个意义上来说,chiplet 就是一个新的 IP 重用模式。未来,以 chiplet 模式集成的芯片会是一个“超级”异构系统,可以为 AI 计算带来更多的灵活性和新的机会。
2.1 chiplet 模式简介
chiplet 的概念,其实很简单,就是硅片级别的重用。
以前,设计一个系统级芯片,是从不同的 IP 供应商购买一些 IP,软核(代码)或硬核(版图),结合自研的模块,集成为一个 SoC,然后在某个芯片工艺节点上完成芯片设计和生产的完整流程。
未来,对于某些 IP,你可能不需要自己做设计和生产了,而只需要买别人实现好的硅片,然后在一个封装里集成起来,形成一个 SiP(System in Package)。所以 chiplet 也是一种 IP,但它是以硅片的形式提供的。
话说回来,要实现 chiplet 这种新的 IP 重用模式,首先要具备的技术基础就是先进的芯片集成封装技术。SiP 的概念很早就有,把多个硅片封装在一个硅片里也有很久的历史了。但要实现 chiplet 这种高灵活度,高性能,低成本的硅片重用愿景,必须要先进的芯片集成技术,比如 Intel 最近提出的 Foveros,3D 集成技术。
3D 集成技术使我们的芯片规模可以在三维空间发展,而不是传统的限于二维空间。由于在二维空间里,摩尔定律已经很难延续,向三维发展也是一个自然的趋势。此外,正如下图所说的,这种 3D 集成技术除了提供更高的计算密度之外,还可以让我们重新考虑系统架构(enabling a complete rethinking of system),这个也就是 chiplet 模式给我们带来的各种新的灵活性,后面再详细讨论。
2.2 chiplet 和 SoC 的区别
先有chiplet的应用,才能够集成为一个 SoC;chiplet是在硅片级别的重用;chiplet 技术就是像搭积木一样实现新的 IP 重用模式。
SoC:System on Chip的缩写,称为芯片级系统,也有称片上系统,意指它是一个产品,是一个有专用目标的集成电路,其中包含完整系统并有嵌入软件的全部内容。
2.3 AI chiplet 的优势
总得来说,我个人认为 chiplet 模式对于 AI 硬件的长期发展会有非常正面的影响,主要体现在下面几个方面。
第一,工艺选择的灵活性
chiplet 模式的最大优势之一就是一个系统里可以集成多个工艺节点的硅片。
这也是 chiplet 模式可能支持快速开发,降低实现成本的一个重要因素。大家知道,在芯片设计中,对于不同目的和类型的电路,并不是最新的工艺就总是最合适的。在目前的单硅片系统里,系统只能在一个工艺节点上实现。而对于很多功能来说,使用成本高风险大的最新工艺即没有必要又非常困难,比如一些专用加速功能和模拟设计。如果 chiplet 模式成立,那么大家在做系统设计的时候则有了更多的选择。对于追求性能极限的模块,比如高性能 CPU,可以使用最新工艺。而特殊的功能模块,比如存储器,模拟接口和一些专用加速器,则可以按照需求选择性价比最高的方案。
这一点对于 AI 芯片的发展是相当有利的。首先,AI 加速本身就是一个 DSA(专用领域架构),其架构本身就是专门为特定运算定制的,具有很高的效率,即使选择差一两代的工艺,也可以满足很多情况的要求。但目前,大多数这个领域的初创公司,都面临工艺选择的困境。如果选择先进工艺,可能一次投片就耗尽所有投资。如果不选,好像一下就输在了起跑线。如果 chiplet 模式成为主流,大家的工艺选择应该可以更加理性,工艺虽不是最新但性价比最好的 chiplet 会有更多机会。第二,对于很多可能大幅提升 AI 运算效率的新兴技术,比如存内计算,模拟计算(包括光计算),它们使用的器件往往只在相对较低的工艺节点比较成熟,和系统的其它部分怎么集成就是个大问题。chiplet 模式也可以解决这个问题,则这些技术的开发商可以以 chiplet IP 的形式提供产品,和其它不同工艺的功能模块集成在一起,而无需受限于 Foundry 工艺的进展。
第二,架构设计的灵活性
以 chiplet 构成的系统可以说是一个“超级”异构系统,给传统的异构 SoC 增加了新的维度,至少包括空间维度和工艺选择的维度。首先,如前所述,先进的集成技术在 3D 空间的扩展可以极大提高芯片规模。这当然对 AI 算力的扩展和成本的降低有很大好处。第二,结合前述的工艺灵活性,我们可能在架构设计中有更合理的功能 / 工艺的权衡,有利于 AI SoC 或者 AIoT 芯片更好的适应应用场景的需求。第三,系统的架构设计,特别是功能模块间的互联,有更多优化的空间。在目前的 AI 芯片架构中,数据流动是主要瓶颈。HBM(也可以看成是一种 chiplet)可以在一定程度上解决处理器和 DRAM 之间的数据流动问题,但价格还过于昂贵。对于云端 AI 加速,Host CPU 和 AI 加速芯片之间,以及多片加速芯片之间的互联,目前主要通过 PCIe,NvLink,或者直接用 SerDes 等等。如果是 chiplet 方式,则是硅片的互联,带宽,延时和功耗都会有巨大的改善。另外,目前的片上网络 NoC 是在一个硅片(2D)上的,而未来的 NoC 则扩展到硅片之间,特别是和 Active Interposer 结合,就可能成为一个 3D 网络,其路由,拓扑以及 QoS 可以有更多优化的空间。
第三,商业模式的灵活性
chiplet 模式在传统的 IP 供应商和芯片供应商之外,提供了一个新的选择:chiplet 硅片供应商。对于目前的 AI 芯片厂商来说,要么聚焦在 AI 加速部分,以 IP 形式或者外接硬件加速芯片的形式提供产品;要么走垂直领域,做集成 AI 加速功能的 SoC。对于前者来说,chiplet 可以提供一个新的产品形式,增加潜在的市场,或者拉长一代产品(工艺)的生命周期。对于一些硅实现能力比较强的厂商来说,也说不定未来会演变成专门做 chiplet 的供应商。对后者来说,可以直接集成合适 AI chiplet 而不是 IP(还需要自己做芯片实现),大大节约项目开发的时间。
因此,可以预见,AI chiplet 会成为 AI 硬件重用和集成的重要模式。
2.4 chiplet 模式的挑战
首先当然是集成技术的挑战。chiplet 模式的基础还是先进的封装技术,必须能够做到低成本和高可靠性。这部分主要看 foundry 和封装厂商。随着先进工艺部署的速度减缓,封装技术逐渐成为大家关注的重点。此外,集成技术的挑战还来自集成标准。回到 CHIPS 项目,可以看出,该项目的重点就是是设计工具和集成标准。Intel 的 AIB(Advanced Interface Bus)就是一个硅片到硅片的互联标准,如果未来能够成为业界的标准(类似 ARM 的 AMBA 总线标准的作用),则 chiplet 的模式就可能更快的普及。还有,对于这种“超级”异构系统,其更大的优化空间也同时意味着架构优化的难度也会大大增加。
除了集成技术之外,chiplet 模式能否成功的另一个大问题是质量保障。我们在选择 IP 的时候,除了 PPA 之外,最重要的一个考量指标就是 IP 本身的质量问题。IP 本身有没有 bug,接入系统会不会带来问题,有没有在真正的硅片上验证过等等。在目前的 IP 重用方法中,对 IP 的测试和验证已经有比较成熟的方法。但对于 chiplet 来说,这还是个需要探索的问题。虽然,相对传统 IP,chiplet 是经过硅验证的产品,本身保证了物理实现的正确性。但它仍然有良率的问题,而且如果 SiP 中的一个硅片有问题,则整个系统都受影响,代价很高。因此,集成到 SiP 中的 chiplet 必须保证 100%无故障。从这个问题延伸,还有集成后的 SiP 如何进行测试的问题。将多个 chiplet 封装在一起后,每个 chiplet 能够连接到的芯片管脚更为有限,有些 chiplet 可能完全无法直接从芯片外部管脚直接访问,这也给芯片测试带来的新的挑战。