优化分支的意义
按照喵喵讲的,cpu执行指令,有预解码,解码等过程,在执行前一段指令的时候就会将将要执行的指令加载到解码流水线上做预处理,但是如果存在分支的情况下,加载指令可能不是将要执行的代码。
利用Intel的vtune测试Hardware Issue选项可以看到分支预测的情况。
一般来讲
95%的分支预测成功是正常的
90%表示还有提高的空间
75%表示非常糟糕
if(condition)
dowork1;
else {
dowork2;
}
cpu在执行if(condition)的时候到底加载谁?dowork1还是dowork2? 不可预测。 所以减少分支是有必要的。
Example
将数字0-15转换成16进制
分支写法
char vtohex(int v) {
if(10 >= v) {
return v+48;
} else {
return 55+v;
}
}
表映射
char vtohex(int v) {
static char m[] = {'0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd', 'e', 'f'};
return m[v];
}
与或去分支
char vtohex(int v) {
return v + 55 - (((v-10) >> (sizeof(int)-1)) & 7) ;
}