今天我们来研究一下 Python 中较快的循环方式。
for…in 是Python程序员使用最多的语句,for 循环用于迭代容器对象中的元素,这些对象可以是列表、元组、字典、集合、文件,甚至可以是自定义类或者函数
比如说有一个简单的任务,就是从 1 累加到 1 亿,我们至少可以有 7 种方法来实现,列举如下:
1、while 循环
使用 while 循环,只要条件为真,我们就可以执行一组语句。
[Python
def
while_loop(n``=``100_000_000``):
i ``=
0
s ``=
0
while
i < n:
s ``+``=
i
i ``+``=
1
return
s
|
2、for 循环
for 循环用于迭代序列(即列表,元组,字典,集合或字符串)。
for 循环不需要预先设置索引变量。
[Python]
def
for_loop(n``=``100_000_000``):
s ``=
0
for
i ``in
range``(n):
s ``+``=
i
return
s
|
3、sum range
[Python]
def
sum_range(n``=``100_000_000``):
return
sum``(``range``(n))
|
4、sum generator(生成器)
[Python]
def
sum_generator(n``=``100_000_000``):
return
sum``(i ``for
i ``in
range``(n))
|
5、sum list comprehension(列表推导式)
[Python]
def
sum_list_comp(n``=``100_000_000``):
return
sum``([i ``for
i ``in
range``(n)])
|
6、sum numpy
[Python]
import
numpy
def
sum_numpy(n``=``100_000_000``):
return
numpy.``sum``(numpy.arange(n, dtype``=``numpy.int64))
|
7、sum numpy python range
[Python]
import
numpy
def
sum_numpy_python_range(n``=``100_000_000``):
return
numpy.``sum``(``range``(n))
|
上述 7 种方法得到的结果是一样的,但是消耗的时间却各不相同,你可以猜测一下哪一个方法快,然后看下面代码的执行结果:
[Python]
import
timeit
def
main():
l_align ``=
25
print``(f``'{"1、while 循环":<{l_align}} {timeit.timeit(while_loop, number=1):.6f}'``)
print``(f``"{'2、for 循环':<{l_align}} {timeit.timeit(for_loop, number=1):.6f}"``)
print``(f``'{"3、sum range":<{l_align}} {timeit.timeit(sum_range, number=1):.6f}'``)
print``(f``'{"4、sum generator":<{l_align}} {timeit.timeit(sum_generator, number=1):.6f}'``)
print``(f``'{"5、sum list comprehension":<{l_align}} {timeit.timeit(sum_list_comp, number=1):.6f}'``)
print``(f``'{"6、sum numpy":<{l_align}} {timeit.timeit(sum_numpy, number=1):.6f}'``)
print``(f``'{"7、sum numpy python range":<{l_align}} {timeit.timeit(sum_numpy_python_range, number=1):.6f}'``)
if
__name__ ``=``=
'__main__'``:
main()
|
执行结果如下所示:
比较快的方式
for 比 while 块
for 和 while 本质上在做相同的事情,但是 while 是纯 Python 代码,而 for 是调用了 C 扩展来对变量进行递增和边界检查,我们知道 CPython 解释器就是 C 语言编写的,Python 代码要比 C 代码慢,而 for 循环代表 C,while 循环代表 Python,因此 for 比 while 快。
numpy 内置的 sum 要比 Python 的 sum 快
numpy 主要是用 C 编写的,相同的功能,肯定是 numpy 的快,类似的,numpy 的 arange 肯定比 Python 的 range 快。
交叉使用会更慢
numpy 的 sum 与 Python 的 range 结合使用,结果耗时最长,见方法 7。最好是都使用 numpy 包来完成任务,像方法 6。
生成器比列表推导式更快
生成器是惰性的,不会一下子生成 1 亿个数字,而列表推导式会一下子申请全部的数字,内存占有较高不说,还不能有效地利用缓存,因此性能稍差。