分支处理的成本
为什么处理一个排序过的数组比处理一个未排序的数组更快?
这个简单的问题可能会引发我们对现代计算机处理器工作方式的深入思考。在探索CPU如何高效执行指令的过程中,我们不仅会发现答案,还会揭示一系列复杂且引人入胜的概念,包括分支预测、指令级并行性以及编译器优化技巧。
在这篇文章中,我们将深入探讨这个问题,并了解为什么在某些情况下,对数据进行预处理(如排序)可以显著提高程序的执行速度。这不仅是关于数据组织的问题,更是关于现代处理器如何利用其架构来优化指令执行的故事。
分支的成本
当CPU遇到条件跳转或任何其他类型的分支语句时,它不会闲置的等待其条件计算完成。相反,它会立即开始预测性地执行看起来更有可能进入的分支。在执行过程中,CPU计算每条指令所采取的分支的统计信息,经过一段时间后,它们开始通过识别常见模式来预测分支。
因此,分支的真实“成本”在很大程度上取决于它能被CPU预测的程度。如果它是纯粹的50/50抛硬币问题,我们就不得不忍受控制危害并丢弃整个流水线,然后再花费15-20个周期重新建立。而如果分支总是或从不被采用,你几乎不需要支付任何成本,除了检查条件。