性能密度、集成系统带来的性能优势、易于从现有的基于Arm的设计中迁移、以及符合RISC-V标准配置文件和核准的扩展和指令,是APXM-6200具备的四大优势。同时,随着云端、边缘和设备中对计算能力的需求不断增长,在面积和功耗严格受限的情况下,这样的设计理念和能力也顺应了下一代异构计算的需求。
2010年,RISC-V项目创始人David Patterson、Andrew Waterman、Yunsup Lee和Krste Asanovic开始思考,既然在互联网、操作系统、数据库、编译器、图像等行业都有开放的标准、免费及开放的实现方式和私有化的实现方式,那么有没有可能在处理器IC领域也打造一个真正开源的、免许可、免授权费用指令集架构(ISA)?未来,能否用模块化IC或者是用软件定义硬件的理念,辅之以社区的方式,去设计和维护相关标准?在这一背景下,RISC-V项目应运而生。
民主化和加速计算
“RISC-V本身并不是一种开源的CPU,而是一个开放的ISA标准,这一点需要得到澄清和共识。就我个人的理解而言,RISC-V在计算领域的两大作用,一是实现计算的民主化,二是实现对计算的加速。”Imagination Technologies计算部副总裁Shreyas Derashri日前在接受《电子工程专辑》采访时表示,尽管不是全新的架构,但RISC-V包含了过去30年里人们对于精简指令计算(RISC)架构的知识、理解和创新,其可扩展的现代架构特性非常适用于下一代AI/ML计算。
总部位于瑞士的RISC-V基金会目前拥有约3900家会员,且数量还在持续增长。而作为其中一员,Shreyas Derashri认为Imagination在RISC-V领域的核心竞争力来自三点:卓越性、生态系统领导力、以及“有能力打造集中化、一体化的架构体系”,而Catapult CPU IP系列的最新产品APXM-6200 CPU则是上述理念的集中体现。
事实上,这并不是Imagination在RISC-V领域的首次尝试。2021年,Imagination正式宣布推出Catapult 系列 RISC-V 内核,并基于此打造了四款不同的CPU产品,分别是:动态微控制器、实时嵌入式CPU、高性能应用处理器CPU和支持汽车功能安全的CPU。目前,首款RISC-V MCU实现已集成到经过硅验证的Imagination BXS GPU中,用于汽车功能安全应用;实时CPU RTXM-2200也已授权给多家客户。
Shreyas Derashri强调称,Imagination是唯一一家能够将RISC-V CPU、GPU和AI所有IP产品集于一身的企业,而这三种IP在当代SoC设计中的占比超过50%。此外,公司提供的集成系统不仅包括硬件IP,还包括软件库、Profilers(剖析器)、调试器和追踪工具,所有这些工具的开发也都考虑到了功能安全和信息安全性。
显然,这样的设计理念和能力顺应了下一代异构计算的需求。毕竟随着云端、边缘和设备中对计算能力的需求不断增长,在面积和功耗严格受限的情况下,大量数据的处理面临着前所未有的挑战。在用加速器来处理日益多样化的工作负载时,异构计算架构是提供高性能、高灵活性和高弹性计算的关键。
全新Catapult CPU,加速RISC-V设备采用
最新的数据显示,得益于传感器在物联网和消费应用领域的广泛部署、AI的日益普及、以及用户体验的复杂性增加推动了对集成图形的需求,采用RISC-V架构的设备数量正在激增。预计到2030年,这一数字将超过160亿台。其中,在消费市场将达到84亿台,复合年增长率(CAGR)为43.8%;工业市场虽然规模较小,但复合年增长率也达到了47.5%,而这正是RISC-V非常看好的两大重要市场应用。
但与此同时,消费和工业市场也面临不少现实挑战。一是两大市场比较强调“降本增效”,即一方面对性能要求不断提高,另一方面对成本又十分敏感,他们希望芯片制造商能在尽可能小的面积内实现尽可能高的性能;二是系统在集成、内存和带宽利用率等方面始终未能达到最佳状态,有很大的优化空间;三是作为一种新的ISA,RISC-V仍面临不少生态系统方面的忧虑,尤其是在软件/工具和库、产品质量、对CPU的特性化/测试/文档和支持不足、架构迁移过程中的软硬件适配,等等。
APXM-6200正是为了应对上述挑战而推出的第二款64位按序应用处理器,具备双发11级指令流水线,128位矢量单元以高效的方式提供高达每核64GOPS的矢量性能,客户可根据自己的性能需求选择单核、双核和四核配置,并可通过每核功率控制实现最高系统效率和缓存连贯性。
此外,该CPU还具有专用的内核供电控制、自定义的供电控制单元、完整的多核调试和追踪架构、先进的中断控制架构、以及cache配置方案,加速器并发端口(ACP)可将人工智能加速器与CPU集成在一起。由于支持RISC-V矢量扩展并具有专门针对AI加速器的快速数据耦合,这款处理器能够为AI功能提供助力,满足下一代消费和工业设备对计算和智能用户界面的需求。
性能密度,集成系统带来的性能优势,易于从现有的基于Arm的设计中迁移,以及符合RISC-V标准配置文件和核准的扩展和指令,是Shreyas Derashri列举的APXM-6200具备的四大优势。
下图展示了APXM-6200在提高性能和性能密度方面做出的努力。可以看出,在其面积效率配置中,它比Arm Cortex-A53小约25%,比Cortex-A55小近40%,约为Cortex-A510的三分之一。但与Cortex-A53相比,6200能够提供超过2.5倍的性能密度。
“之所以选择A53做比较,是因为A53是Arm发布过的最成功的产品,我们这次主要对标的是性能密度。如果从微体系架构方面来看,APXM-6200则是一个更加现代化的处理器,内置的矢量指令、加速器并发端口等功能,也更适用于AI应用。”Shreyas Derashri说。
APXM-6200支持Android 和Linux操作系统,可以广泛应用于智能电视、智能家居中枢和数字标牌等设备中。考虑到其中许多设备还需要使用GPU处理图形用户界面,而作为业界RISC-V架构SoC的首选GPU IP供应商,Imagination在设计CPU、GPU系统以提供更高性能方面具有独特的能力,当APXM-6200与Imagination GPU搭配使用时,总线利用率提高了一倍,内存流量减少了一半。
Shreyas Derashri指出,从安卓的角度来看,可穿戴、机顶盒和DTV(数字电视)类应用将率先转向RISC-V架构,但移动类应用可能需要几年时间才能在安卓系统上成熟起来。接下来,RISC-V生态需要继续在编译器、强化对不同架构和操作系统的支持、以及优化安卓应用程序方面开展工作,让其以更优的形式表现出来。但不管怎样,“所有应用领域都有可能被RISC-V所颠覆”的趋势不会改变,哪些生态系统会首先采用RISC-V是关键因素。
轻松的设计迁移和灵活的用途,是RISC-V生态最关注的话题,也是帮助客户建立信心最重要的方法之一。为此,Imagination提供了Catapult SDK软件开发套件,提供嵌入式开发人员为目标应用编写、构建和调试软件所需要的一切工具,包括一套能够提升AI工作负载性能的全新矢量计算库。
除了该SDK之外,Imagination还为微软流行的Visual Studio Code集成开发环境(IDE)提供了一个名为Catapult Studio的扩展。现在,任何Visual Studio用户都可以访问该市场,并将该Catapult扩展安装到他们的常规开发环境中。这意味着,开发人员现在就可以抢在硬件上市之前,使用其中所包含的QEMU(快速仿真器)和Catapult软件模型来构建和运行RISC-V软件。
为了便于迁移,Imagination还在RISC-V 软件生态系统(RISE)中开展了大量工作,尤其是APXM-6200所需的软件工作负载。按照Shreyas Derashri的说法,RISE中运行着48个主要软件程序,Imagination正在跟踪所有程序,特别是与APXM相关的用例。“我们正在牵头推动这些程序走向成熟。同时,也有足够的信心确保客户SoC上市时,呈现给他们一个支持APXM-6200应用的成熟软件生态系统。”
在当今这个AI加持的互联世界中,安全性对于消费和工业应用至关重要。伴随着RISC-V的普及,向成熟安全框架无缝迁移也势在必行。为此,APXM-6200采用可与知名成熟安全框架无缝集成的多域隔离解决方案,能够在不影响安全性的情况下轻松导入到SoC设计中。同时,Imagination也通过与RISE合作,确保RISC-V支持OP-TEE这一业界广泛支持的开放式可信执行环境(TEE)操作系统。
Shreyas Derashri还同时提醒业界说,RISC-V本身并不是开源代码,而是一个开放的标准,这两个还是有所区别的。当然,“安全性”是现在一个非常好、明确打造的特点,它能够提供更好的解决方案,也会有自己专利性的架构,会是行业迈出的非常重要的一步。
在与其他RISC-V提供商进行比较时,可以明显看出一些提供商正在努力进行安全创新。但这种创新给希望将新解决方案集成到SoC中的芯片制造商带来了挑战,因为它们必须同时进行硬件和软件更新,而且这些较新的方法也没有在市场上得到验证。因此,RISC-V的第一步应该是支持行业标准框架(例如 TrustZone),一旦这个基础建立起来,客户就可以向市场推出创新的安全解决方案。
在谈及“RISC-V是否已经为进军汽车、服务器等高端应用做好了充足准备”的话题时,Shreyas Derashri回应称,RISC-V要想取得成功,最重要的一点就是要有强大的生态系统支持,要有更多像APXM-6200这样建立在RISC-V基金会已核准的扩展指令和配置基础上的产品进入市场,只有这样,软件生态系统才能够围绕这些CPU 进行更有力的宣传和创新。
“从创新速度来看,RISC-V比Arm架构要快得多,扩展能力也更强,从入门级微控制器到高端数据中心级CPU都能胜任,在RISE和 RISC-V基金会等国际组织的强力推动下,RISC-V进军高端应用的生态系统正在从蓝图变为现实。”Shreyas Derashri表示。