利用Intel的vtune测试Hardware Issue选项可以看到分支预测的情况。 一般来讲
95%的分支预测成功是正常的
90%表示还有提高的空间
75%表示非常糟糕
如何提高分支预测的效率, 下面列举了一些特例表示可以考虑的优化方向
case 1
if(t1==0&&t2==0&&t3==0) {
// do something
}
====>
if(t1|t2|t3==0){ // 合并条件,提高分支预测成功率
// do something
}
case 2
if(int i=0; i<1000; ++i){ // for cpu 密集调用
if(cond) // 分支预测
do();
else
do2();
}
==============》
if(cond){ // 避免了CPU密集调用时进行分支预测
if(int i=0; i<1000; ++i) do();
}else{
if(int i=0; i<1000; ++i) do1();
}
case 3
for(int i=0; i<10000; ++i){ // 此时要进行多次分支预测
if(a<10){
fun1();
}else(a<25){
fun2();
}else{a<50}{
fun3();
}else{
fun4();
}
}
==========》
typedef void(*Func)();
Func funarray[n]; // 利用函数指针数组来避免多次运行时候的分支预测
Funarray[1] = &fun1;
…
for(int i=0; i<10000; ++i){
funarray[a]();
}
case 4:
if(color<0) color=0;
================⇒
color &=~(color>>31); // 注: 右移 负数补1 正数补0