ARM发布AMRv9指令集:IPC性能大涨30%、华为也能用

来源:硬件世界,作者:宪瑞

微信公众号:芯片之家(ID:chiphome-dy)

昨天凌晨,ARM正式推出了ARMv9指令集,官方称之为10年来最重要的创新,将是未来3000亿ARM芯片的基础。

包括目前性能最强的Cortex-X1/A78在内,现在所用的ARM芯片还是基于ARMv8.x指令集的,2011年首次推出,主要特点是增加了64位指令集支持。

相比之下,ARMv9的升级看点就多了,过去10年计算架构有了太多变化,ARM处理器也不止是移动/嵌入式专用了,已经扩展到了PC、HPC高性能计算、深度学习等等新市场。

ARMv9在兼容ARMv8的基础上,提升了安全性、增强了矢量计算、机器学习及数字信号处理,同时继续提升处理器性能。

首先来说说性能上的变化,以智能手机等移动平台使用的Cortex-X/A系列为例,X1/A78这一代的性能相比16nm A72提升2.5倍,下一代的Matterhorn架构及Makalu架构会保持30%以上的IPC性能提升。

IPC提升与频率无关,如果再考虑到未来工艺带来的频率增加,那么CPU性能有望提升40%以上。

除了CPU性能,ARMv9还非常重视整体的性能提升,包括降低内存延迟(从150ns降至90ns)、频率提升(从2.6GHz到3.3GHz)内存带宽(从20GB/s到60GB/s)、缓存等。

ARMv9这次与性能有关的一个重要升级是SVE2指令集,SVE最早是ARM与富士通合作的浮点性能扩展,日本最强也是TOP500最强超算富岳就使用了SVE指令集,现在推出的是第二代SVE浮点指令了。

相比SVE的128位矢量,SVE2可以支持多倍128位运算,最多2048位,因此SVE2可以增强ML机器学习、DSP信号处理能力,提升了未来5G、虚拟现实、增强现实以及CPU本地运行ML的性能,同时ARM未来还会继续提升AI人工智能性能。

除了CPU之外,这次还简单提到了未来的Mali GPU,ARM会增加更多高级功能,比如VRS可变帧率渲染、RT光线追踪及其他高级渲染技术等。

在ARMv9中,最重要的一项挑战其实是数据安全,这一次ARM推出了全新的CCA机密计算体系架构,基于之前的TrustZone安全技术,但引入了动态域技术,它对操作系统及管理程序来说是完全不透明的,不会被系统或者软件提权攻击,而且依然可以接受管理及调度。

总之,ARM今天公布的ARMv9指令集极具创新,是未来10年3000多亿ARM芯片的基础,不过现在具体的细节还很少,只是一个初步的路线图,今年夏天还会公布更多详细内容。

至于ARMv9处理器的商业化,预计会在2021年底的时候进入市场。

此外,很多人非常关心一个问题,那就是华为还能不能使用ARMv9?

对于这个问题,在今天下午的Arm Vision Day中国沟通会上,ARM官方人员透露了重要信息,内容如下:

ARM既有源于美国的IP,也有非源于美国的IP。经过全面的审查,ARM确定其ARMv9架构不受美国出口管理条例(EAR)的约束。

ARM已将此通知美国政府相关部门,我们将继续遵守美国商务部针对华为及其附属公司海思的指导方针。

 往期好文阅读 

芯片之家精选文章合集 (一):收藏起来慢慢看

芯片之家精选文章合集 (二):收藏起来慢慢看

点击阅读????

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
注意,该课程属于《ARMv8/ARMv9架构从入门到精通》课程的其中一章2021年3月底,ARM公开了armv9的架构,那时CCA(Confidential Compute Architecture 机密计算)进入大众的视野。当时就觉得很厉害。2021年6月份,ARM公开armv9架构的更多细节,RME(Realm Management Extension)手册也随之公不出来。RME是一套崭新的安全架构,是Trustzone/虚拟化/FF-A的进一步的补充,是安全架构的进一步的飞越式的发展。 相信在这一套技术体系种,将充分发挥硬件的安全特性,也相信在这套体系种,软件行业也能够飞速发展。 第一节 课程介绍第二节 ARMv8/ARMv9的Trustzone深度解读第三节 ARMv9 CCA/RME技术简介第四节 ARMv9 RMA技术详解(以下是第四节的展开)1. RME扩展2. RME Architecture3. Software Architecture4. Security State -- PE5. Switch CPU_Context6. 物理地址空间7. Translation Regime8. EL3 Translation Regime9. Non-secure state translation regimes10. Secure state translation regimes11. Realm state translation regimes12. Root state translation regimes13. TLB & Cache14. 地址空间的访问15. Completer side filtered16. Granule Protection Checks17. 地址翻译的过程18. GPC19. 相关寄存器20. GPT21. GPT Table Descriptor22. GPT Granules配置的权限23. Granule Protection Check faults24. MPAM25. cache扩展26. TLB扩展27. Elision(省略)28. 术语 (注意:本课是《ARMv8/ARMv9架构学习系列课程》中的一个章节。)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值