如何优化程序性能

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0HR3D09z-1610031215959)(https://github.com/mengxiaoxu/mengxiaoxu.github.io/raw/master/_posts/images/深入理解计算机系统/优化程序性能/达克效应.JPG)]

    这篇笔记主要是摘抄了具体的代码示例,从代码中体会如何优化程序的性能,《深入理解计算机系统》已经看了近三分之二了,越看越发现自己懂得太少太少了,正在题图中的绝望之谷徘徊(我自认为是这样),至少比在愚昧山峰左边的山脚徘徊要好很多。

    我们的编译器已经提供了很好的优化机制,但是还有很多细节编译器优化不到,或者说没胆量去优化,因为有一些激进的优化很有可能会违背程序员的初心。

// 第一种
void twiddle1(long *xp, long *yp){
    *xp += *yp;
    *xp += *yp;
}

// 第二种
void twiddle2(long *xp, long *yp){
    *xp += 2* *yp;
}

    例如上面的程序,看到第一种写法,我们可能很容易的就想到第二种写法,但是编译器却不会把它变成这种写法。乍看它们没什么区别,我们来分析一下内存引用。第一种需要 3 次内存引用,即读\*xp、读\*yp、写\*xp;而第二种却需要 6 次内存引用,即2 次读\*xp、2 次读\*yp、2 次写\*xp。所以第一种的性能要比第二种好。

    那编译器看到第一种为什么就想不到第二种写法呢?这不是很简单的规则吗?实际上上面的程序存在xp = yp的情况,即两个指针指向同一个内存位置。

// 第一种
*xp += *yp; // xp 处存放的值乘以 2
*xp += *yp; // xp 处存放的值乘以 2

// 第二种
*xp += 2* *yp; // xp 处存放的值乘以 3

    可以看到,当它们都指向同一块内存时,第一种写法会让原来的值增加 4 倍,而第二种写法会让原来的值增加 3 倍,产生了不同的效果,而编译器会当这种情况可能出现,所以编译器并不会帮我们优化第一种代码,这需要程序员自己去维护。

消除循环的低效率

    相信很多人都写过下面类似的代码,貌似没有什么可以优化的,写的挺好。

void lower1(char *s){
    long i;
    for(i = 0; i < strlen(s); i++){
        if(s[i] >= 'A' && s[i] <= 'Z'){
            s[i] -= ('A' - 'a');
        }
    }
}

    仔细看,会发现每次循环都会去调用strlen()函数,而这个函数明显是要拖累性能的,实际上我们只需要计算一次长度就可以了,现在却每次循环都需要去计算一次长度,所以可以将计算移到前面只计算一次的地方。

void lower2(char *s){
    long i;
    long len = strlen(s);
    for(i = 0; i < len; i++){
        if(s[i] >= 'A' && s[i] <= 'Z'){
            s[i] -= ('A' - 'a');
        }
    }
}

    编译器虽然会试着去进行代码的移动,但是最终还是没有优化,是因为改变在哪里调用函数或者调用多少次函数的变换,编译器并不能比较可靠的发现一个函数是否有副作用,比如下面的情况。

long f();

long func1(){
    return f() + f() + f() + f();
}

long func2(){
    return 4*f();
}

    这段代码和开篇提到的代码在形式上很像,可能你会说:它们不会指到同一块内存了呀,编译器这也不去优化吗?考虑一下f()是下面的形式。

long count = 0;

long f(){
    return count++;
}

    是不是一下就发现问题了,func1()调用 4 次f(),而func2()只调用 1 次f(),它们最终的结果绝不是简单的 4 倍关系。

编写适合条件传送实现的代码

    如果编译器能够产生使用条件数据传送而不是条件控制转移的代码,那么就可以大大的提高程序的性能,关于条件数据传送和条件控制转移在旧文顺序、条件、循环语句的底层解释中描述的已经很明确了。比如下面的第一种写法就比第二种要好。

// 第一种
void minmax1(long a[], long b[], long n){
    long i;
    for(i = 0; i < n; i++){
        if(a[i] > b[i]){
            long t = a[i];
            a[i] = b[i];
            b[i] = t;
        }
    }
}

// 第二种
void minmax2(long a[], long b[], long n){
    long i;
    for(i = 0; i < n; i++){
        long min = a[i] < b[i] ? a[i] : b[i];
        long max = a[i] < b[i] ? b[i] : a[i];
        a[i] = min;
        b[i] = max;
    }
}

    暂时就写这几个吧,还有个消除不必要的内存引用,因为它的性能问题不能从代码中直接看出来,就不放出来了,工作中尽自己所能写出优雅的代码。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Guanngxu

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值