参考来源:《超标量处理器设计》—— 姚永斌
两位饱和计数器
根据分支指令前两次的执行结果预测本次指令方向。
只有两次预测都失败了才会改变预测结果。
但是会出现分支方向发生变化时,状态机永远无法饱和,导致预测正确率较低。
这里可以通过格雷码对状态机进行编码,减少错误概率并降低功耗(减少翻转bit)。
正常来说,每个指令的PC值都对应一个两位饱和计数器。
考虑到并不是所有指令都是分支指令,所以一般采用如下方法存储两位饱和计数器的数值。
PHT (Pattern History Table) 存放PC中对应的两位饱和计数器的值,利用PC中的k bit数据在PHT中寻址。
PHT的大小为2 ^ k* 2,但是k值相同的PC值可能会引起别名问题(假设都存在分支跳转),但是可以采用HASH处理别名问题。
PHT - Pattern History Table
比较不同PHT大小对于分支预测的准确率影响。
可以看到PHT在大于5121KB之后,对分支预测准确率提升并不大。
并且在设计时要考虑这部分空间对硬件资源的占用影响。
关于PHT更新有三个时间点:
- 流水线取指阶段,进行分支预测时根据结果更新PHT。缺点是预测结果可能是错误的。
- 流水线执行阶段,分支指令方向被计算出来时更新PHT。缺点是乱序执行时,因为前后无相关性,也可能是错误的。
- 流水线提交阶段,分支指令要离开流水线时更新PHT。这里最晚,但是预测结果一定是正确的,因为分支指令已经能够确认是否正确执行了。