关于gcc的__builtin_expect分支预测优化

最新推荐文章于 2025-04-24 11:20:23 发布

code_peak

最新推荐文章于 2025-04-24 11:20:23 发布

阅读量751

点赞数

分类专栏： C++

本文链接：https://blog.csdn.net/code_peak/article/details/118947324

版权

C++ 专栏收录该内容

24 篇文章

订阅专栏

在阅读 sylar框架源代码上看到了使用 __builtin_expect 的宏定义，一时有所不解，于是查找了很多资料，对并其做整理。

Linux 下的很多代码我们经常看到 likey() 和 unlikely() 这两个宏，通常这两个宏定义是如下这样的形式：

#define likely(x)      __builtin_expect(!!(x), 1)
#define unlikely(x)    __builtin_expect(!!(x), 0)

可以看出这两个宏都是使用了函数 __builtin_expect 来实现的，这两个函数是 GCC 的一个内建函数(build-in function)，在 GCC2.96 版本中引入的，其声明如下：

long __builtin_expect(long exp, long n);

参数：exp 是一个整型表达式，如 (ptr != NULL)，n 必是一个编译器常量，是我们期望的 exp 表达式的值。

返回值：返回值只等于第一个参数 exp 的表达式结果。

作用：这个函数主要是帮助我们处理 if 的分支预测。当你期望 exp 表达式的值等于常量 n 时，那么执行 if 分支的概率很大，否则执行 else 分支的概率很大，这个概率关系到编译器的优化，下面会介绍。

下面先测试该函数的的返回值：

int a = 10;
cout << __builtin_expect(a, 1) << endl; //输出：10

a = 100;
cout << __builtin_expect((a == 100), 0) << endl;  //输出：1

可以看到该函数的返回值仅仅时对 exp 表达式的结果值。__builtin_expect 这个宏定义其实对表达式本身的值是没有影响的，而主要的作用就是在汇编层优化我们的代码，减少跳转的次数。

我们再看 likely 和 unlikely 宏：

第一个参数是 !!(x) 其作用主要是将表达式 (x) 变为一个 bool 值，不论表达式 (x) 是多少，最后的结果就是 true 或 false.

因为 likely 和 unlikely 实际调用就是调用 __builtin_expect，而他们的第二个参数中 likely 是 1，而 unlikely 是 0，也就是告诉编译器优化执行哪个分支的概率很大。

我们通过如下程序，来进一步说明：

int test_likely(int x)
{
    if (LIKELY(x))
        x = 5;
    else
        x = 6;
    return x;
}

int test_unlikely(int x)
{
    if (UNLIKELY(x))
        x = 5;
    else
        x = 6;
    return x;
}

int test(int x)
{
    if (x)
        x = 5;
    else
        x = 6;
    return x;
}

test 函数就是一个 if-else 分支条件，我们正常使用都是没有什么问题，但是如果想要追求极致，我们从这段代码中发现一个问题，像这种判断都是有偏向性的，比如使用 if-else 结构时经常通过 else 补充一些以外的情况，这个时候其实更多的执行是在 if 里面的，也因此我们发现了这种偏向性可以优化的点。在上面这段代码中：

如果大部分情况落在 x = 5 时，我们采用 test_likely 中的解决办法。

当大部分情况落在 x = 6 时，我们采用 test_unlikely 。

这里可能有读者有一定疑问，为什么这样就能减少跳转的次数，下面说一下其原因。

流水线引入 CPU，可以提高 CPU 的效率，也就是 CPU 可以预先取出下一条指令，可以减少 CPU 等待取指令的耗时，从而提高 CPU 的效率。如果存在跳转指令，预先取出的指令就无用了。CPU 在执行当前指令时，从内存中取出当了当前指令的下一条指令。执行完当前的指令后，CPU 发现不是要执行下一条指令，而是执行 offset 偏移处的指令，CPU 只能重新从内存中取出 offset 偏移处的指令。所以跳转指令会降低流水线的效率。

在写程序时，尽量避免跳转语句，如果避免也就是使用 __builtin_expect。这个指令时 gcc 引入的，作用就是：允许程序员将最有可能执行的分支告诉编译器。这个指令的写法为：__builtin_expect(EXP, N)，其意思就是 EXP == N 的概率很大，而且一般会将其封装为两个 LIKELY 和 UNLIKELY 宏，上面已经说过。

关于其为什么会减少跳转次数，可以看上面实例程序的汇编代码，使用编译命令：

gcc -fprofile-arcs -O2 -c test_builtin_expect.c
objdump -d test_builtin_expect.o

输出的汇编代码如下：

<test_likely>:
    push     %ebp
    mov      %esp,%ebp
    mov      0x8(%ebp),%eax
    addl     $0x1,0x38
    adcl     $0x0,0x3c
    test     %eax,%eax
    jz       2d <test_likely+0x2d>    //主要看这里：此处的效果是eax不为零时，不需要跳转。即x为真是不跳转。
    addl     $0x1,0x40
    mov      $0x5,%eax
    adcl     $0x0,0x44
    pop      %ebp
    ret
    addl     $0x1,0x48
    mov      $0x6,%eax
    adcl     $0x0,0x4c
    pop      %ebp
    ret
    lea      0x0(%esi,%eiz,1),%esi
    lea      0x0(%edi,%eiz,1),%edi

<test_unlikely>:
    push     %ebp
    mov      %esp,%ebp
    mov      0x8(%ebp),%edx
    addl     $0x1,0x20
    adcl     $0x0,0x24
    test     %edx,%edx
    jne      7d <test_unlikely+0x2d>   //主要看这里：此处的效果是edx为零时,不需跳转。即x为假时不跳转。
    addl     $0x1,0x30
    mov      $0x6,%eax
    adcl     $0x0,0x34
    pop      %ebp
    ret
    addl     $0x1,0x28
    mov      $0x5,%eax
    adcl     $0x0,0x2c
    pop      %ebp
    ret
    lea      0x0(%esi,%eiz,1),%esi
    lea      0x0(%edi,%eiz,1),%edi

可见编译器通过 __builtin_expect 做出了判断，优化并生成了高效的代码，也就是同样能达到目的但有很大概率不会跳转语句。

参考：
__builtin_expect — 分支预测优化
 __builtin_expect详解
 GCC __builtin_expect的作用