CPU有一条可以容纳至多100条指令的管线,这些指令游戏是已经被执行过了的。当CPU遇到一个分支指令(即函数调用或者if语句),它依然会往管线中追加指令,即使这条分支还没有被执行(我想这里是说先不管分支是否会执行,都会先把代码中后续的指令压入管线)。
如果这个分支是带条件判断的,CPU会尝试猜测该把什么指令压入管线。当这个分支指令执行完毕,如果CPU猜错了,CPU会从管线中清空这些(先前猜测并压入管线的)指令并重新开始(定位正确的指令并压入管线)。
如果你清楚CPU是如何猜测的,你就可以写出尽量减少这种清理工作的代码来:
情况一:CPU会认为将要执行的代码是在较低的内存地址上
情况二:CPU会认为将要执行的代码是在较高的内存地址上
第一种情况的例子是 do-while 循环。 (也就是说CPU会猜想循环会回去继续)
第二种情况的例子是 for/while/if循环。(也就是CPU总是猜想循环条件会成立)
因此如果性能很重要的话,这样的代码应该避免使用:
for (...)
{
if (...)
continue;
if (...)
continue;
if (...)
continue;
Do Real Work.
}
我们尽量应该在if等后面放执行可能性最大的代码,这样可以防止CPU不断的取消错误的“猜想”。比如应该这么写:
if( ... )
{
if( ... )
{
...
}
}
虽然前者在很多时候显得更清晰,但是为了效率,咱还是快改习惯吧,Over。
(原材料来自epic: udn : optimizecode;感谢曾西友情解析 ).