高性能计算——分支处理的成本

walt3433

已于 2024-03-18 17:22:44 修改

阅读量529

点赞数 20

分类专栏：高性能计算（HPC）文章标签： c++ 性能优化算法

于 2024-03-18 17:21:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/walt3433/article/details/136815367

版权

高性能计算（HPC）专栏收录该内容

18 篇文章 0 订阅 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

本文深入探讨了CPU如何通过分支预测优化指令执行，解释了分支处理的成本和影响程序性能的原因。通过实验展示了分支预测的重要性，特别是在排序和未排序数组处理中的区别，揭示了编译器优化和提示分支可能性的策略。

摘要由CSDN通过智能技术生成

分支处理的成本

文章目录

分支处理的成本
提示分支的可能性

为什么处理一个排序过的数组比处理一个未排序的数组更快？

这个简单的问题可能会引发我们对现代计算机处理器工作方式的深入思考。在探索CPU如何高效执行指令的过程中，我们不仅会发现答案，还会揭示一系列复杂且引人入胜的概念，包括分支预测、指令级并行性以及编译器优化技巧。

在这篇文章中，我们将深入探讨这个问题，并了解为什么在某些情况下，对数据进行预处理（如排序）可以显著提高程序的执行速度。这不仅是关于数据组织的问题，更是关于现代处理器如何利用其架构来优化指令执行的故事。

分支的成本

当CPU遇到条件跳转或任何其他类型的分支语句时，它不会闲置的等待其条件计算完成。相反，它会立即开始预测性地执行看起来更有可能进入的分支。在执行过程中，CPU计算每条指令所采取的分支的统计信息，经过一段时间后，它们开始通过识别常见模式来预测分支。

因此，分支的真实“成本”在很大程度上取决于它能被CPU预测的程度。如果它是纯粹的50/50抛硬币问题，我们就不得不忍受控制危害并丢弃整个流水线，然后再花费15-20个周期重新建立。而如果分支总是或从不被采用，你几乎不需要支付任何成本，除了检查条件。

一

了解本专栏

超级会员免费看

关注

20
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

walt3433 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。