如何基于CPU的架构来优化软件的性能？

最新推荐文章于 2023-10-12 16:47:28 发布

wangeen

最新推荐文章于 2023-10-12 16:47:28 发布

阅读量2.6k

点赞数 1

本文链接：https://blog.csdn.net/wangeen/article/details/8142252

版权

本文探讨了如何基于CPU架构优化软件性能，包括提高分支预测成功率、有效利用L2缓存、针对不同指令集优化、谨慎使用超线程技术以及合理设置线程亲和性和优先级。

摘要由CSDN通过智能技术生成

一直想弄一个从各种角度优化软件的总结，先写一个从CPU架构角度的。

现在的CPU都有流水线的概念，所谓的流水线就好似一个制造工厂的流水线，把一个大的任务分成若干小块然后分给不同的人做，当一条流水线走完也就制造好了，CPU的流水线也是类似，只不过他是把一个个对应与汇编语言的指令拆开成更小的单元uopt，放到流水线上顺次运行以增加速度，流水线相对与并行是实现起来相对简单，每个部分只要做好自己的事情就行了，现在的流水线越做越深已经达到二三十的深度了，同时CPU的指令情况比生活中的制造业复杂很多，流水线上的内容总是变化的，而且存在一定的前后依赖关系，我们不能保证一个东西已经放到了流水线上东西是前面的正在处理的部分想要的，比如后面突然遇到了if else的情况，后面的流水线上都是if下面的内容，但是我们要的使else里面的就要清空并且重新加载流水线上已有的内容，这个的代价就很高了，所以CPU就有了一个新的功能来尽量避免这样的事情，就是分支预测，CPU会用自己的算法纪录下更个分支的使用概率，尽量加载概率高的那个分支，来避免资源浪费，这里就有一些从代码上的优化的空间，比如尽量减少if else switch之类的，还有概率高的放前面，不过这个比较值得商榷，放前面也不一定就会高效率，因为CPU已经替我们做了这个事情。

CPU还有个特性就是有L1 L2分段缓存，对于分段缓存我们尽量让他们都利用好，不要因为部分数据的需求刷里面的内容，比如二维数组的纵向变例会比横向遍历糟糕很多，因为横向遍历会保证cache中数据的连续性，纵向遍历就要频繁的刷新cache。

最低0.47元/天解锁文章

wangeen

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
如何基于CPU的架构来优化软件的性能？

一直想弄一个从各种角度优化软件的总结，先写一个从CPU架构角度的。现在的CPU都有流水线的概念，所谓的流水线就好似一个制造工厂的流水线，把一个大的任务分成若干小块然后分给不同的人做，当一条流水线走完也就制造好了，CPU的流水线也是类似，只不过他是把一个个对应与汇编语言的指令拆开成更小的单元uopt，放到流水线上顺次运行以增加速度，流水线相对与并行是实现起来相对简单，每个部分只要做好自己
复制链接

扫一扫