如何加速一个简单的for循环?

我们先来看一段非常简单的代码

for i in range(10000):
   x[i] = x[i] + 10

看到这代码,肯定有小伙伴会有疑问,这么简单的代码你告诉我竟然可以优化???

file

不急不急,且听我慢慢分析:

首先我们要意识到,这个循环体循环了10000次。

那么加速的其中一个关键就是减少循环次数,因为每次循环结束之后本质上都是一个分支指令的判断,判断这次循环是否结束。如果是则跳出循环,进行下一个代码块的执行,否则继续循环。

我们可以充分利用cpu内的寄存器。

程序在执行前,编译器会自动给我们的加法指令分配各个不同的寄存器,避免指令流水线的数据冲突,这样循环内多路并行也降低了时间开销。 得此,优化后我们的程序如下:

for i in range(0, 10000, 5):
   x[i] = x[i] + 10
x[i+1] = x[i+1] + 10
x[i+2] = x[i+2] + 10
x[i+3] = x[i+3] + 10
x[i+4] = x[i+4] + 10

经过测试,优化后的程序所花时间为69ms,而未经优化的程序时间为81ms。

饱受leetcode超时困扰的小伙伴,这样的小trick也许能帮助你们侥幸过关!

file

如果对这些优化感兴趣的小伙伴,可以参考计算机体系结构相关内容学习。

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值