创新驱动发展,Arm 2023 全面计算解决方案为智能时代赋能

当今数字化时代,人们对移动端计算能力的要求已经上升到了前所未有的高度。作为全球领先的芯片制造商之一,Arm 一直在推动高性能、高能效计算的发展。随着移动设备的需求不断增长,开发者和制造商对 Arm 架构的应用也越来越广泛。无论是高端智能手机、平板电脑,还是智能家居设备,基于 Arm 架构的芯片都在其中扮演着关键的角色。

为了应对未来计算的复杂需求,确保数百万开发者能够轻松地在 Arm 架构的平台上无缝开发,Arm 架构不断推陈出新,于近日推出了更加先进的计算解决方案——2023 全面计算解决方案 (TCS23)。该解决方案涵盖了全新旗舰级 Immortalis GPU、全新 Armv9 CPU 集群以及新的提升和优化,为开发者提供了更易访问软件的全新增强技术。全新的 Immortalis-G720 GPU 专为旗舰智能手机设计,可带来 15% 的性能提升,减少了多达 40% 的内存带宽用量,有助于实现更出色且持久的帧率,最终带来更高质量的图形。全新的 Cortex-X4 CPU 内核是 Arm 公司打造的第四代 Cortex-X 内核,性能提高了 15%,并带来了一个可以显著降低功耗多达 40% 的高能效微架构,而面积仅增加了 10%。全新的 Cortex-A720 CPU 和 Cortex-A520 CPU 相对于其上一代在能效方面都提高了 20%。此外,全新的 DSU-120 控制器专门为了满足高要求的多线程用例而设计,可大幅提升 CPU 性能,同时降低能耗。

其实早在10年前,Arm 就开始陆续将64位处理器推向市场,从32位向64位计算的过渡期是一个缓慢的过程,但他们始终坚信64位才是正确的方向。因为它不光保证了更高的性能,也进一步夯实了计算安全。如今,Arm 2023 全面计算解决方案为未来几代智能手机、平板电脑、物联网设备和笔记本电脑等设备提供了更加高效、节能、安全的处理器解决方案及动力。这些设计方案被授权给高通、联发科、三星以及其他芯片制造商集成到自己的解决方案中,进一步提升了市场竞争力。

在 Arm 媒体技术日上,来自 Arm  终端事业部产品管理高级总监Kinjal Dave、Arm 终端事业部产品管理总监Saurabh Pradhan、Arm 终端事业部产品管理高级总监 Anand Patel、Arm 终端事业部软件战略总监 卢旻盛、Arm 终端事业部生态系统及工程高级总监 Geraint North等Arm公司的多位事业部负责人以及技术负责人详细介绍了Arm 2023全面计算解决方案的部署与技术细节,为与会者展开一幅绚丽的技术画卷。

一、从解决方案的角度开发技术产品,打造全面系统级平台

外界可能并不知晓,事实上,Arm 从2019年起一直坚持着从解决方案的角度进行技术产品的开发。据Arm 终端事业部产品管理高级总监Kinjal Dave介绍,Arm 开始走这条路,是因为当时看到市场对性能以及效率的要求达到历史新高。无论是电视供应设备还是大型数据中心,市场对设备的要求越来越高,每一代新出来的终端设备都会经历所谓的周期,这就是对于算力要求的提升。然而,经历这样的循环和周期变得越来越难,而且成本也越来越高。Arm 意识到确实存在难度,因此通过 TCS 的方式来进行开发,希望能够打造一个全面系统级的平台来应对这些挑战。

Arm在解决方案设计方面的方法论,是采取全局的方法论来开发解决方案,不断推高性能、提高效率。这意味着,Arm 公司在每年推出的 TCS 在性能跟效率方面都必须实现进步。比如在今年最新的解决方案中,Kinjal Dave 向观众们展示了TCS23中的软件,包括了三大支柱,即性能安全以及开发者的可访问性。其中,机器学习是一个非常重要的工作负载,Arm 更新了他们的库软件,包括 Arm NN 和 Arm Compute Library (ACL),这些软件库都是开源的,可以帮助开发者优化在 Armv9 架构 CPU 和 GPU 上面的机器学习复杂性。

另外,Arm 在移动图形生态系统中的布局也十分全面,他们提供了强大的开发工具,并与全球主要的游戏引擎工作室进行合作,推动图形技术的进步,以实现产品的优化。并且 Arm 还为开发者提供丰富的培训和最佳实践信息文件,以帮助他们改善创意。除此之外,在 CPU 和 GPU 方面,Arm 推出了最新的图形处理器 Immortalis-G720,基于第五代 GPU 架构打造,同时引入全新的 CPU 集群,包含一个新的 Cortex-X CPU,它展现了令人难以置信的高效和高性能。新的 Cortex-A700 系列 CPU 是这个全新 CPU 集群的主力芯片,提供了出色的性能效率,以实现持续高性能和支撑多线程的工作负载。还有下一代 Cortex-A500 系列的小核,它延续了我们最具面积和功率效率的微架构优势,主要适用于设备上的轻量级的工作负载和背景任务。

在物理 IP 领域,Arm 为最新的工艺节点和库优化了其 IP,并且利用他们在 RTL 方面的专长配置物理 IP,以此在先进的技术上,为基于产品的设计、制造提供了优化的 EDA 流程与物理实现。在过去的四年间,Arm 一直在努力促成 CPU、GPU 和系统级 IP 元素的融合,通过方案式的开发满足不同客户共同的需求,真正实现 1+1 大于 2 这样的 IP 集合。这些 IP 合集除了能让合作伙伴获得更高的性能和效率外,更重要的是能让合作伙伴开发出针对新的工作负载和更新的计算类型的产品。

与此同时,Arm 终端事业部产品管理总监 Saurabh Pradhan 也为大家介绍了 Cortex-X 产品历史以及 Armv9 架构的重要性。Pradhan 指出,Armv9 架构支撑了从安全到机器学习一系列的功能,是安卓高端机选用的主要原因之一。其中 MTE 和指针验证技术是 Armv9 架构中非常重要的技术,有助于提高开发者体验。比如 SVE2 可伸缩矢量扩展,能够帮助开发者进行编程平台的复用,降低开发成本。同时,使用 MTE 技术后可以检测到 90% 的内存安全漏洞,从而提高应用的安全性。

另外,据 Arm 首席 CPU 架构师兼研究员 Ian Caulfield 描述,在TCS23中,Cortex-X4、Cortex-A520 和 Cortex-A720 均为基于最新的 Armv9.2 架构的纯 64 位 IP 产品,具有高性能、高效能和高效能的特点,能够满足不同市场的需求。

Cortex-X4:Arm连续第4年实现双位数性能提升的 Cortex-X 系列产品,性能提升 15%,最高可以支持每个核 2M 的 2 级缓存;

Cortex-A520:实现了最佳的电源效率,相较于 Cortex-A510 提升了 22% 的能效。封装最小的 Cortex 产品,适用于入门级和终端的手机设备;

Cortex-A720Arm 公司主力产品之一,持续性能方面处于业界领先地位。高效方面相较于 Cortex-A715 实现了 20% 的提升,在面积配置性方面有扩展,适配于其他档次手机的需求。

这意味着 Arm 已经完成了向 64 位的迁移。Arm 首席 DSU 架构师兼研究员 Alex Waugh 表示,一个全面解决方案需要有 DSU 才完整,今年 ARM 公司发布了 DSU-120,DSU 不仅可以把所有 IP 很好地结合在一起,同时也是催化剂,能够实现 CPU 集群最好的性能和效率。DSU 实现了可伸缩性、新的 PPA等全新的一些功能,可以支持带宽分区、节点最大化等,从而可以支持 14 核以上的设备,为 Arm 开发者提供了一站式全面的解决方案。

二、Arm GPU全新升级,安全与生态共赢成未来发展重点

在所有旗舰级的 SoC 中,我们可以看到 GPU 对芯片面积预算的需求每年都在增加。这是因为 GPU 不仅要负责处理图像和视频,还要承担其他高级任务,如人工智能、机器学习等。随着技术的不断进步,GPU 的复杂性和性能要求也在不断提高,这就需要更多的芯片面积预算来支持其发展。对于移动设备而言,GPU 的重要性更是不容忽视,GPU 作为移动设备中的核心组件之一,必须要具备强大的性能和高效的功耗管理,以满足用户的需求。因此,GPU 对芯片面积预算的需求增加也在情理之中。

Arm媒体技术日上,Arm 终端事业部产品管理高级总监 Anand Patel 针对Arm全新的第五代 GPU 架构作出了解析。并推出了Immortalis-G720、Mali-G720 和 Mali-G620 三款全新的 GPU 产品。这些新产品将面向广泛的市场,从高端的智能手机到笔记本电脑、汽车、电视、VR、机顶盒、手机等,为开发者提供领先的性能和效率。

第五代 GPU 架构的推出是 Arm GPU 产品线的重大里程碑。相较于上一代架构,第五代 GPU 架构在系统级的图形性能方面有着显著提升,旨在推动下一代视觉计算的交付。该架构专注于提高功效,并且带来更具有沉浸感的游戏以及实时 3D 应用程序,让用户体验更加出色。在第五代 GPU 架构的元年,Arm 将继续专注于处理效率,关注关键技术趋势。Arm 希望提高这个领域的性能,并且推动这个趋势进一步发展。同时,Arm 也关注内存系统的功率,尤其是在散热方面。如果能够实现持续减少内存系统的功率,就可以将更多的功率分配给 GPU,从而实现更高质量的视觉效果,也可以用于延长电池的续航时间。

基于Arm 全新第五代GPU架构,今年Arm推出了Immortalis-G720、Mali-G720 和 Mali-G620 三款全新的 GPU 产品。Immortalis-G720 是旗舰产品,持续提供光线追踪技术,并且有不少于十个着色器内核; Mali-G720 能支持 6-9 个内核; Mali-G620 提供多达5个内核。这些新品的发布标志着 Arm 在 GPU 领域取得了重大进展,并且这些产品在性能和效率方面均表现出色,能够赋能设备最新的图形功能,为开发者带来了显著的效率性能的提升。

除了性能和效率提升以外,“安全”也是 Arm 今年的重要主题之一。内存安全对于整个科技行业的影响是一个老问题,但一直以来都没有得到很好地解决。随着软件数量和复杂性的不断增加,内存安全漏洞的数量也在持续增长。据美国国家标准和技术研究院的报告,过去几年中发现的安全漏洞中,内存安全漏洞占据了超过 70% 的比例。这使得内存安全的问题变得更加严重。

为了应对这一问题,Arm 采取了一些措施。Arm 终端事业部软件战略总监卢旻盛介绍称,MTE 不仅是 Armv9 的基础性能,也是 64 位架构和应用未来的趋势。MTE 采用了两阶段系统,即“锁”和“密钥”,来防止空间和时间型风险。在锁和密钥两阶段系统中,存在两种类型的标记: 

地址标记,用作密钥。这将在进程中每个指针的最高位增加四位。地址标记仅适用于64位应用,因为它使用了“高字节忽略”功能,这是 Arm  64 位的一个功能。;

内存标记,用作锁。内存标记也由四位组成,与应用内存空间中每个对齐的 16 字节区域相连接。Arm 将这些 16 字节区域称为标记颗粒。这四位并不用于应用数据,而且是分开存储。

除了 MTE 之外,Arm 还与其他合作伙伴合作,致力于提高软件质量和安全性。Google 的 Chrome project 和微软的 Windows 操作系统都曾指出内存安全漏洞占据了 CVE 非常严重的软件漏洞的比例超过 70%。Arm 与 Google 合作,在新的编译语言和底层硬件平台增加新的功能,以更好地保护整个安卓生态圈的安全和可靠性。现场还有来自MediaTek 无线通信事业部资深总监 章立、vivo 芯片规划和架构高级总监 夏晓菲、荣耀公司MagicOS DFS架构师 余亮、快手 Android 架构师 李锐 等不同合作伙伴的嘉宾均分享了他们对内存安全的看法以及如何减少内存安全漏洞的方法。总的来说,内存安全是一个长期而且需要共同努力的问题。Arm 和其他合作伙伴正在共同努力,通过提高软件质量和安全性,以及提供更好的硬件平台来减少内存安全漏洞。

当一个新的技术进入市场的时候,如何与生态系统合作进行技术推广,如何对最终的用户体验打造哪种赋能,是一个平台必须重视的问题。而Arm 对于与生态伙伴携手共进的决心是非常坚决的。Arm 终端事业部生态系统及工程高级总监 Geraint North向大家介绍了他们在软件和生态系统合作方面的工作成果,以及对于未来技术发展的展望,包含了以下4个重要主题。

1、将 64 位部署到移动领域,以及下一步的发展方向

随着 64 位处理器的普及,移动领域也即将迎来 64 位时代。Arm 表示,他们已经为移动领域准备好了 64 位处理器 IP 产品,并将在未来的产品中继续推广。此外,他们还将在软件和生态系统方面进行投资,以帮助合作伙伴快速适应 64 位时代。

2、安全技术

Aem已经推出了多项安全技术,包括 AES-NI、VPN、ARMv8-A 加密等,以保障用户数据的安全。未来将继续投资研发,以提高产品的安全性能。

3、性能优化

为了提高产品的性能,Arm 将继续进行架构优化,尤其是在 Armv8 和 Armv9 系统之上。此外,还将投资研发 PAC 和 BTI 技术,以提高产品的反应速度和流畅度。

4、与 Unity 和 Google 的合作

Arm 与 Unity 和 Google 进行了合作,与推出了一项名为安卓动态性能框架的技术。该技术可以帮助合作伙伴更好地优化他们的应用程序,从而提高用户体验。此外,还将在安全技术方面进行合作,以保障用户数据的安全。

值得一提的是,安卓动态性能框架是安卓系统开发者们为了解决不同手机散热和功耗局限因素而不断努力开发的一个适应性工具和库的套件。该套件的关键组成部分包括 APDF 提示 API、APDF 散热 API、游戏模式 API 和游戏状态 API 四个部分。其中,APDF 提示 API 可以帮助系统根据游戏中的情况提高或降低 CPU 的频率,而 APDF 散热 API 则能够为开发者提供数字信号,告诉他们离所谓的热阀值还有多远。游戏模式 API 则是向开发者提供关于用户性能或电池偏好的一些建议,而游戏状态 API 则允许游戏告诉系统他们在做什么,以便可以调整以满足游戏的性能需求。

该套件的核心问题是 scheduler 这个调度器并没有从用户空间获得足够的信息,来了解目前的状态,因此工作会过于保守,在提升或降低性能方面受到影响。为了解决这个问题,安卓动态性能框架让游戏或应用程序向操作系统发送关于实际和预测的工作负荷持续时间的信号。这样操作系统就可以非常精准地增加或减少时钟,改善电池和性能。此外,安卓动态性能框架还解决了 scheduler 在空闲状态上升到最大频率时需要 200ms 的问题,通过避免缓存提升来优化性能。

如今开发者现在已经可以使用这些工具,特别是在新手机上,而且也可以通过 Unity 的插件获得这些工具,或者通过 API 调用直接提供给开发者。此外,开发者可以使用一组线程直接设计时间,以确保正确的工作在正确的核心上进行,而不是使用过去的工具如 setAffinity 进行猜测。最后,安卓动态性能框架可以在安卓游戏开发工具包网站上提供更多的信息,以帮助开发者更好地利用这些工具。

总的来说,Arm 公司的软件和生态系统合作方面的工作成果丰硕,并且未来将继续投资研发,以推动未来的技术发展,值得业界关注和期待。

三、引领行业技术创新,推动产业发展

作为全球领先的半导体公司之一,Arm 一直致力于打造更加高效、安全、创新的 GPU 应用方案,以满足用户的需求。本次发布最新的 GPU 架构和三款全新的 GPU 产品,不仅提升了产品的性能和效率,而且也为开发者提供了更多的选择和灵活性。

从行业角度来看,Arm 公司的技术和产品解决方案在半导体行业中一直处于领先地位,其品牌影响力和市场份额也一直处于上升态势。尤其是在移动设备和物联网领域,Arm 公司的技术和产品已然成为行业的标准。未来,随着人工智能技术的不断发展和普及,Arm 公司也将继续推动技术创新和产业发展,为开发者和用户提供更加高效、安全、创新的技术和产品解决方案。

未来,Arm 公司将继续推动技术创新和产业发展,为开发者和用户提供更加高效、安全、创新的技术和产品解决方案,以及提供更多的选择和灵活性,为行业发展和共赢注入新的动力和活力。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值