C++分支代码效率与CPU的关系

最新推荐文章于 2024-07-14 11:37:24 发布

pizi0475

最新推荐文章于 2024-07-14 11:37:24 发布

阅读量1.2k

点赞数

分类专栏：技术理论文章标签： c++ 游戏工作

技术理论专栏收录该内容

1010 篇文章 11 订阅

订阅专栏

CPU有一条可以容纳至多100条指令的管线，这些指令游戏是已经被执行过了的。当CPU遇到一个分支指令（即函数调用或者if语句），它依然会往管线中追加指令，即使这条分支还没有被执行（我想这里是说先不管分支是否会执行，都会先把代码中后续的指令压入管线）。
如果这个分支是带条件判断的，CPU会尝试猜测该把什么指令压入管线。当这个分支指令执行完毕，如果CPU猜错了，CPU会从管线中清空这些（先前猜测并压入管线的）指令并重新开始（定位正确的指令并压入管线）。
如果你清楚CPU是如何猜测的，你就可以写出尽量减少这种清理工作的代码来：

情况一：CPU会认为将要执行的代码是在较低的内存地址上

情况二：CPU会认为将要执行的代码是在较高的内存地址上

第一种情况的例子是 do-while 循环。（也就是说CPU会猜想循环会回去继续)
第二种情况的例子是 for/while/if循环。（也就是CPU总是猜想循环条件会成立）

因此如果性能很重要的话，这样的代码应该避免使用:

for (...)
{
    if (...)
       continue;
    if (...)
       continue;
    if (...)
       continue;

    Do Real Work.
}

我们尽量应该在if等后面放执行可能性最大的代码，这样可以防止CPU不断的取消错误的“猜想”。比如应该这么写：

   if( ... )

        if( ... )

...

    虽然前者在很多时候显得更清晰，但是为了效率，咱还是快改习惯吧，Over。

（原材料来自epic: udn : optimizecode；感谢曾西友情解析 ).

pizi0475

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录