Python 标准库之 itertools 使用指南
0 前言
内建模块 itertools 实现了许多迭代器构建块,受到 APL、Haskell和 SML 等的启发,标准化了一个快速、高效利用内存的核心工具集,提供了用于操作迭代对象的函数,它们一起构成了一个“迭代器代数(iterator algebra)”,这使得在纯Python中有可能创建简洁又高效的专用工具。
使用 next(迭代器)
可以取得迭代器对象下一个生成的值。
1 无限迭代器 infinite iterators
count
参数:itertools.count(start=0, step=1)
用途:创建一个迭代器,它从 start 值开始,返回均匀间隔的值,即生成初始值为start,公差为step的等差数列。常用于 map() 中的实参来生成连续的数据点。此外,还用于 zip() 来添加序列号。
应用:
count(10) # 10 11 12 13 ...
count(10, 0.5) # 10 10.5 11 11.5 ...
# 注:浮点数计数时,通过下面的方法可以获得更好的准确性
(10 + 0.5 * i for i in count()) # 10.0 10.5 11 11.5 ...
map(lambda x: 2 * x**2 + 1, count()) # 1 3 9 19 33 51 ...
zip(count(), ['a', 'b', 'c']) # [(0, 'a'), (1, 'b'), (2, 'c')]
cycle
参数:itertools.cycle(iterable)
用途:创建一个迭代器,返回 iterable 中所有元素并保存一个副本。当取完 iterable 中所有元素,返回副本中的所有元素。无限重复。
应用:
cycle(['a','b','c']) # a b c a b c a ...
cycle(range(3)) # 0 1 2 0 1 2 0 ...
repeat
参数:itertools.repeat(object, times=None)
用途:创建一个迭代器,不断重复 object 。除非设定参数 times ,否则将无限重复。可用于 map() 函数中的参数,被调用函数可得到一个不变参数。也可用于 zip() 的参数以在元组记录中创建一个不变的部分。
应用:
repeat('abc') # abc abc abc ...
repeat(range(3)) # range(0, 3) range(0, 3) range(0, 3) ...
repeat(1, 3) # 1 1 1
map(pow, range(5), repeat(2)) # 0 1 4 9 16
zip(repeat('num'), [1,2,3]) # [('num', 1), ('num', 2), ('num', 3)]
2 有限迭代器 Iterators terminating on the shortest input sequence
accumulate
【Python 3.8 更改:添加了可选的 initial 形参】
参数:itertools.accumulate(iterable, func=operator.add, *, initial=None)
用途:创建一个迭代器,返回累积汇总值或其他双目运算函数的累积结果值(通过可选的 func 参数指定)。通常,输出的元素数量与输入的可迭代对象是一致的。 但是,如果提供了关键字参数 initial,则累加会以 initial 值开始,这样输出就比输入的可迭代对象多一个元素。
应用:
accumulate([1,2,3,4,5]) # 1 3 6 10 15
accumulate([1,2,3,4,5], operator.mul) # 1 2 6 24 120
accumulate([1,2,3,4,5], min) # 1 1 1 1 1
accumulate([1,2