为什么处理已排序数组比处理未排序数组更快?

很久以前在stackoverflow上看到下面这段代码,今天忍不住把它摘录过来。

#include <algorithm>
#include <ctime>
#include <iostream>

int main()
{
    // Generate data
    const unsigned arraySize = 32768;
    int data[arraySize];

    for (unsigned c = 0; c < arraySize; ++c)
        data[c] = std::rand() % 256;

    // !!! With this, the next loop runs faster
    std::sort(data, data + arraySize);

    // Test
    clock_t start = clock();
    long long sum = 0;

    for (unsigned i = 0; i < 100000; ++i)
    {
        // Primary loop
        for (unsigned c = 0; c < arraySize; ++c)
        {
            if (data[c] >= 128)
                sum += data[c];
        }
    }

    double elapsedTime = static_cast<double>(clock() - start) / CLOCKS_PER_SEC;

    std::cout << elapsedTime << std::endl;
    std::cout << "sum = " << sum << std::endl;
}

上面的程序在保留 std::sort(data, data + arraySize); 语句时,程序运行时间是 1.93 秒;但去掉排序语句后,程序运行时间是 11.54 秒。

问题:为什么会出现这种情况?

解答:分支预测。

考虑以下 if 语句块。对于处理器来说,就是一个分支指令,如下:

IF

处理器每次遇到一条分支时,它都不知道该走哪一条道。这时候该怎么办?程序停下来,等待前面的指令执行完,得到确切的结果后,再接着走某一条分支。

现代处理器都支持指令并行处理和超流水线作业。因此,当处理器遇到程序分支时,都会去猜测应该走哪一条分支。

如果猜对了,程序接着流畅运行。如果猜错了,则处理器需要做一些额外的工作,再次回到那条正确的分支。

因此,如果处理器每次都猜错,那程序的运行时间就会边长。

这就是上面的代码为什么运行时间会相差那么大的原因。

对于分支语句:

if (data[c] >= 128)
    sum += data[c];

在保留 std::sort(data, data + arraySize); 的情况下。数组 data 中的内容是这样的:

T = branch taken
N = branch not taken

data[] = 0, 1, 2, 3, 4, ... 126, 127, 128, 129, 130, ... 250, 251, 252, ...
branch = N  N  N  N  N  ...   N    N    T    T    T  ...   T    T    T  ...

       = NNNNNNNNNNNN ... NNNNNNNTTTTTTTTT ... TTTTTTTTTT  (easy to predict)

在未排序的情况下,数组 data 中的内容是这样的:

data[] = 226, 185, 125, 158, 198, 144, 217, 79, 202, 118,  14, 150, 177, 182, 133, ...
branch =   T,   T,   N,   T,   T,   T,   T,  N,   T,   N,   N,   T,   T,   T,   N  ...

       = TTNTTTTNTNNTTTN ...   (completely random - hard to predict)

也就是说,在已经排序的情况下,处理器便能更好的预测分支了。因此,程序也运行的更快。

关于分支预测

阅读 Linux 源代码时,你会发现 if(likely( )){} 或是 if(unlikely( )) 这样的语句。对于条件选择语句,gcc 内建了一条指令用于优化,在一个条件经常出现,或者该条件很少出现的时候,编译器可以根据这条指令对条件分支选择进行优化。而 Linux 内核把这条指令封装成了宏 likely()unlikely()

因此,在编写程序时,如果一个分支条件只有在很少数的情况下才出现时,我们使用 unlikely( )likely( ) 能够加快程序的运行,这也是一种优化程序的手段。

比如这样:

if ( unlikely(statement) ) { //这里便是告诉编译器,这个条件只在少数情况下发生
    dosomething();
}

via 快课网

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值