推动 AMBA 向多芯片和 CHI C2C 发展

Perface

Arm 长期以来携手生态系统,通过高级微控制器总线架构 AMBA® 共同解决复杂的全行业问题。如今,随着行业对芯粒 (chiplet) 的采用,AMBA 也是时候从单个片上拓展至多芯片了。

本文将简要介绍 AMBA 的一致性集线器接口 (Coherent Hub Interface, CHI) 芯片到芯片 (C2C) 方法。CHI C2C 是对片上 CHI 的拓展,该方法目前正处于开发阶段,旨在使 CHI 适用于芯片间及芯粒间的互连。

此外,本文还将阐述 AMBA CHI C2C 如何完善比如通用芯粒互连技术 (UCIe) 等芯粒的标准化工作,以进一步推动协同合作。

为何选择芯粒,又为何是现在?

行业目前正处于一个拐点,芯粒正被广泛用于各个细分领域和应用。

当前系统级芯片 (SoC) 设计面临的巨大经济压力推动了行业对芯粒的投资。SoC 的复杂性和性能要求持续增加,同时每个新的先进芯片工艺节点(5 纳米及以下)的成本也在不断攀升。

然而,这些新节点带来的好处并没有相应增加。例如,**虽然逻辑器件持续扩展,但 I/O 和内存的收益却在递减。**高昂的成本也阻碍了新的 SoC 或衍生产品的开发。

这种情况为芯粒创造了绝佳的机会。芯粒使芯片性能不再受到尺寸的限制,同时还能管理芯片成本,并提供更高的可组合性。

标准化至关重要

AMBA[1] 一直是片上通信的开放标准。它为各种设计提供了一个通用标准,确保 SoC 上的不同组件之间相互兼容。它还具有灵活性、可扩展性、设计复用以及低摩擦设计集成的优点。

AMBA 规范(如 CHI 和 AXI)是免费提供的[2],并由行业合作伙伴共同参与制定。AMBA 被广泛应用于 Arm 生态系统及其它领域。它具备久经验证的可靠性和可信赖度,在过去 27 年中已被用于数十亿颗芯片中,覆盖各个细分市场和应用领域。

AMBA 实现的标准化成为当今 SoC 设计和无晶圆厂半导体模式的基础。这种标准化为构建繁荣生态系统和兼容 IP 和工具的综合市场奠定基础。其中包括处理器、加速器、互连、控制器和外设,以及来自芯片合作伙伴、IP 供应商和其他合作伙伴的验证 IP (VIP)、建模工具和性能工具。

标准化对芯粒的采用同样至关重要。随着行业从当前的定制芯粒平台向多供应商的可组合芯粒发展,标准化对于未来实现开放芯粒生态系统更为关键。

具有定义明确的可互操作层对标准化方法也十分重要。定义明确的可互操作层可支持设计复用,降低成本并缩短产品上市时间。根据用例和需求的不同可以优先选择合适的实现方案,从而提供更大的灵活性并促进创新。

芯粒的发展依赖于物理层、传输层和协议层的标准化外加软件模型、机械、散热和功耗的标准。另外,还少不了芯片验证、可靠性测试、合规性测试及许多其它工作。

为何选择 AMBA CHI?

**AMBA CHI[3] 架构可为连接大量处理器、加速器和内存的系统提供所需的性能和规模。**更根本的是,**CHI 具有高速、可靠和可分组特性,因此非常适合用于芯粒。**同时,CHI 是广泛使用的开放标准,为采用芯粒提供了一种低风险且简单直接的途径。

CHI 协议提供了一个全缓存一致性模型。该模型与架构无关,支持通过 snoop 过滤器和基于目录的系统进行扩展。该协议于 2013 年公布后便不断发展演进[4],不仅增加了新功能,还进行了性能提升[5]。CHI 有着广泛的功能和特性,例如:

  • 原子级和独占事务 (transactions)

  • 用于降低延迟的优化流程,如 DMT、DCT 和 DWT

  • 基于奇偶校验的接口保护

  • 低功耗,具有多种不同的控制级别

  • 写零、数据省略和本地复制,以减少数据传输

  • 分布式虚拟内存 (DVM) 管理

  • 用于机密计算的机密领域管理扩展 (RME)

CHI 作为超大规模计算、服务器和网络基础设施应用的基石,已经取得了巨大成功。CHI 现已广泛用于移动设备和汽车等多个细分市场的诸多应用并得到了验证,而这些应用也需要完整的硬件一致性和高性能。

AMBA CHI C2C 的推出

我们很高兴介绍 AMBA CHI C2C,这是对 CHI 的扩展,并将主要用于芯片(芯粒)间互连。

对于芯片(芯粒)到芯片(芯粒)(C2C),我们指的是芯粒(即多芯片或芯片间)和芯片间(即通过 PCB 连接的多芯片)。

**CHI C2C 面向先进异构系统用例以及基于 Arm 架构的一致性 SMP。**它为设备连接提供了统一的接口,包括计算、加速器和内存。这不仅适用于全一致性传输,也适用于 I/O 和非一致性传输。

CHI C2C 专注于协议层和分包层。它利用现有的片上 CHI 协议并对其分包方式进行定义,使其适合通过芯片(芯粒)间链路进行传输。分包格式对链路利用率和延迟进行了优化,同时避免了复杂的分包和解包方案。

相同的架构特性可以跨越芯片(粒)间的边界,芯片(粒)间可以共享相同的内存和安全模型。这可以避免出现协议转换、不兼容和额外的时延。这种分层方法可以与底层传输彻底分离,因此 CHI 可以在 UCIe 等选项上使用,无论它们是否已标准化。

使用 CHI 和 UCIe 串流

行业领导者纷纷加入 UCIe[6] 以提供标准化的芯片间 (die-to-die) 接口,其发展势头强劲[7]。UCIe 提供了针对芯片间集成而优化的物理层 (PHY) 和适配器,以及软件模型和合规性测试。

UCIe(Universal Chiplet Interconnect Express)是一种由多家业界巨头共同参与制定的通用小芯片(Chiplet)接口标准。它旨在定义一个开放、可互操作的芯粒(Chiplet)生态系统标准,以实现不同芯片厂商和不同制作工艺之间的互联互通。这意味着,英特尔牵头的UCle联盟将为不同芯片厂商和不同制作工艺之间建立统一“沟通用语”,参与联盟的芯片厂商可以共用一套“语言系统”。

UCIe的主要目的是统一Chiplet之间的互连接口标准,这样可以打破各公司技术壁垒,实现真正的互联互通,极大程度上降低复杂芯片的研发和制作成本。此外,通过建立开放性的Chiplet生态系统,UCIe还可以促进更多的创新和合作,加速Chiplet技术的发展。

UCIe架构包括协议层(Protocol Layer)、适配层(Adapter Layer)和物理层(Physical Layer)。协议层支持已经广泛使用的协议PCIe6.0、CXL2.0、CXL3.0,还支持用户自定义的Streaming协议来映射其他传输协议,协议层把数据转换成Flit包进行传输。适配层在协议层和物理层中间,当协议层有多个协议同时工作时,ARB/MUX用来在多个协议之间进行选择和仲裁。物理层主要用来解析Flit包在UCIe Data Lane上进行传输。

总的来说,UCIe是一种先进的芯粒接口标准,旨在促进不同芯片厂商和不同制作工艺之间的互联互通,降低复杂芯片的研发和制作成本,加速Chiplet技术的发展。

UCIe 还提供了极大的协议灵活性。该技术采用了一种多堆栈方法,允许在单个物理链路上使用多个协议。PCIe 和 CXL 可用于传统片外设备,而串流接口可用于插入其它协议,因此非常适合用于传输 AMBA CHI。

下面列举了一个使用 UCIe 串流的基于 CHI 的多芯片系统。该系统具有以下显著优势:

  • 无缝使用架构特有的功能:由于是传输相同的片上 CHI 协议,因而允许无缝使用架构特有的功能,而无需转换协议。

  • 链路稳健性:UCIe 串流接口使用 UCIe 定义的数据链路 CRC 和重试等方式实现链路稳健性。

总结

CHI C2C 规范目前正处于开发阶段,与所有其它 AMBA 规范一样,它将按照现有的 AMBA 许可和治理模型发布。这意味着,除了免费提供、免版税且无架构要求外,它还具有广泛和永久的实现权[注],换言之,非常适合广泛采用。

通过利用现有的 AMBA 许可和治理模型,CHI C2C 将能够与 CHI 协议本身保持同步发展,并符合现有 AMBA 生态系统的要求。当然,我们要确保它针对 UCIe 等传输进行了优化。

该模型沿用了分层的标准化方法和其它协议的现有治理模型,如 CXL 和 PCIe,也可以与 UCIe 一起使用。基于此,我们预计 CHI C2C 将广泛用于各个细分市场和应用领域。随着时间的推移,将从高性能基础设施应用拓展到汽车行业等等。此外,现有基于 AXI 设计的数量庞大,这对于在 C2C 中的实现至关重要。

展望未来,我们期待继续围绕 C2C 与各方展开合作,并为行业提供各种工具,以构建基于标准的优秀芯粒解决方案。

参考资料

推荐资料

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值