【每周至少一篇 160901】循环级别的代码优化(上周补充)

时间紧,这两周的博客主要回顾一下学习《并行算法设计与性能分析》的小部分,希望以后能养成这些习惯。循环级别的优化以发掘循环的并行性、减少寄存器和缓存的使用为主。

循环展开

目的是减少判断数量和改变循环变量的次数。同时注意不易展开过多,要考虑寄存器的数量。

float sum = 0.0f;
for(int i = 0; i < num; i += 4){
    sum += a[i];
}

代码进行展开后

float sum = 0.0f, sum1 = 0.0f, sum2 = 0.0f,sum3 = 0.0f;
for(int i = 0; i < num; i += 4){
    sum1 = a[i + 1];
    sum2 = a[i + 2];
    sum3 = a[i + 3];    
    sum = a[i + 4]; 
}
sum += sum1 + sum2 +sum3;

循环累积

循环累积主要和循环展开同时使用,在减少寄存器使用的同时保证并行度
如展开6次、累积2次后代码清单如所示:

float sum = 0.0f, sum1 = 0.0f, sum2 = 0.0f;
for(int i = 0; i < num; i += 6){
    sum1 = a[i] + a[i +1];
    sum2 = a[i +2] + a[i + 3];
    sum = a[i + 4] + a[i +5];
}
sum += sum1 +sum2;

循环合并

循环的合并减少判断的次数,还能增加指令并行能力

for(int i = 0; i < len; i++){
    x1 += a[i];
}
for(int i = 0; i < len; i++){
    x2 *= b[i];
}

合并之后的代码为:

for(int i = 0; i < len; i++){
    x1 += a[i];
    x2 += b[i];
}

循环拆分

当循环内的变量导致寄存器使用过多,而引发内存和寄存器之间数据交换使得性能下降时,应当实现循环拆分。

总结

在面向对象的编程思想中,关于代码与机器相联系的部分比较少。在整体编程中,以面向对象等高级语言来实现结构优化,以靠近硬件和编译器的角度,来实现降低程序执行时间。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值