最近吐槽ARM芯片应用BUG的投稿确实不少,重灾区主要是ARM异构移植以及KP实测表现,实在不尽如人意。除了发两句牢骚,对于已经做好技术路线选型的同学,我们只能建议尽量做好后续调优,并实时关注终端业务场景表现,或许亡羊补牢还为时未晚。
当然,也有人在问,KP既然这么多坑,为什么还会有那么多人盲踩,大家都不懂技术?
此前其实我们也有提到,一些上层路线打法的确可以影响到用户选型结果,某厂这事儿圈内传闻不少,这里不再多提;另外很关键的一点就是,纸面数据和实测效果是两回事。尤其KP做异构,很多情况下宣传数据可信度太低,建议大家少看广告多验证疗效。
今天我们就基于KP 920的实用性能检验,一起了解下宣传数据和实用效果间的差距,便于大家日后技术路线选型时参考。
KP 920处理器发布于2019年1月,是当时业内首款7nm的ARM处理器,据说专为大数据处理以及分布式存储等应用领域而设计。芯片采用多DIE多核的架构设计,2个CPU DIE支持最多64个核心,共8个DDR4的内存通道,1个IO DIE提供PCIe接口、以太网接口、存储控制器、片间缓存一致接口和硬件加速引擎等功能,可以支持多种数据加解密、压缩/解压缩机制。
HW基于ARM v8.2的公版IP对计算核心、数据通路、IO和缓存等进行了些创新性的改造和设计,魔改能力确实不俗。唯一可惜的是,受美国制裁影响直到如今再没有更新过微架构,也没有创新性的升级换代产品上市(中间倒是推出过和7260相同架构的7265,将CPU主频提升至3.0GHz,不过业界推测应该是同一晶圆硅片质地较好的晶圆DIE优先筛选制造的产物,非创新产品)。
这里也可见CPU产业链之难,被称为人造物的“珠穆朗玛”并非浪得虚名。尤其在美的制裁下,打铁还须自身硬,国产CPU厂商还得靠稳健自主研发实力发展求存。
从spec官网可以查到KP 920 7260基于SPECCPU2017的整型、浮点的计算能力的数据,如下
从以上结果来看,KP 920 7260整型计算能力在HW毕昇编译器、HWopenEuler20.03的操作系统优化后,较之前发布的在GCC9.1 、麒麟v10 环境的318分提升了不少。而浮点算力测有更新环境的数据,不知是HW自己的编译器和操作系统对浮点性能没有加持,抑或是其他原因,现在只能查到263分一个结果。
不过对于SPECPU2017能测出这样的结果,应该算是表现亮眼。此外我们也得到了KP920几种核数产品SPECCPU2017 整型算力和INTEL某款产品的对比,如下:
那么实际使用表现如何呢?
要知道,实际生产场景的业务负载千差万别,更多的情况不是一款或几款测试工具少数测试用例情况能覆盖的。换句话说,CPU生产场景的性能表现并不一定与测试工具测得结果的趋势一致,有时甚至相反或者没有关系。
以实际项目为例,在信创生产调度系统中,主要看“四Y中的两Y,即:Y测和Y信”,生产应用软件压测过程中,HWKP920 7260每秒最多处理2500个Y信变位,与Intel芯片的性能差了不少。
生产调度系统对单核运算能力和CPU整体计算性能都有要求,通常ARM的单核计算性能不及Intel x86产品。在最高压力下,Intel的使用率能压到99%,而KP处理器CPU使用率超过75%业务就崩溃了,在生产环境就不得不多配一些KP服务器来匹配应用的性能需求。
所以不得不说,迷信纸面数据在实际场景中暴雷的概率太高了。能不能承载业务需求、能否达到预期性能,最好的方式是实验摸底检验,毕竟“实践是检验真理的唯一标准”。也只有这样,才能将业务上线后出现的性能风险控制到最小。
其实ARM因功耗省电优势,最初定位在移动端。现在随着移动和桌面应用界限模糊,我们才能在PC服务器领域看到ARM的身影。但是即便在不考虑生态适配的情况下,仅针对国产ARM的性能而言,要满足实际业务场景需求,依然还有很长的路要走。
再次提醒大家,盲目对标纸面数据,贸然选择技术路线,才是入坑的开始。