一. 迭代器
1. 迭代器协议
对象必须提供一个next方法,执行该方法要么返回迭代中的下一项,要么就引起一个StopIteration异常,以终止迭代 (只能往后走不能往前退)
2. 可迭代对象
实现了迭代器协议的对象(如何实现:对象内部定义一个__iter__()
方法)
有`__iter__` 就是对象就是可迭代对象
调用`__iter__`得到的对象就是迭代器,迭代器必须有next方法
3. iter与next
python的内部工具(如for循环,sum,min,max函数等)使用迭代器协议访问对象。
for循环的本质就是遵循迭代器协议去访问对象,但可以使用for循环的对象不一定都是迭代器
对于字符串,列表,元组,字典,集合,文件对象,这些都不是可迭代对象,只不过在for循环时,调用了他们内部的__iter__
方法,把他们变成了可迭代对象。然后for循环调用可迭代对象的__next__
方法去取值,而且for循环会捕捉StopIteration异常,以终止迭代
下面通过例子说明如何将列表这类具有__iter__
方法的对象转化为迭代器
l = [1, 2, 3, 4]
itr = l.__iter__()
while True:
try:
print(next(itr))
except StopIteration:
break
>>1
>>2
>>3
>>4
4. 迭代器优缺点
优点
- 迭代器提供一种不依赖于索引的取值方式,这样可以遍历没有索引的可迭代对象
- 迭代器与列表比较,迭代器是进行惰性计算的,更省内存
缺点
- 无法获取迭代器长度,不如使用列表索引取值灵活
- 迭代器只能遍历一次,不能回退
5. 判断迭代器与可迭代对象
from collections import Iterator, Iterable
f = open('a.txt')
print(isinstance(f, Iterable))
print(isinstance(f, Iterator))
6. 列表解析式
与for循环一起使用,列表解析式最常应用迭代协议的环境之一。
通过for配合列表解析式可以快速生成列表[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
[x*x for x in range(1, 11)]
二. 生成器
1. 生成器概念
可以理解为一种数据类型,这种数据类型自动实现了迭代器协议(其他的数据类型需要调用自己内置的__iter__
方法),所以生成器就是可迭代对象
生成器分类及在python中的表现形式:(Python有两种不同的方式提供生成器)
- 生成器函数:常规函数定义,但是,使用yield语句而不是return语句返回结果。yield语句一次返回一个结果,在每个结果中间,挂起函数的状态,以便下次重它离开的地方继续执行
- 生成器表达式:类似于列表推导,但是,生成器返回按需产生结果的一个对象,而不是一次构建一个结果列表
生成器函数使用方法
def foo():
print('A')
yield 1
print('B')
yield 2
f = foo()
res = next(f)
print(res)
res = next(f)
print(res)
>>A
1
B
2
#可以看出没next一次,函数执行到yield得到yield的返回值,再yield一次再按照上述方法执行一次
yield到底干了什么—>把函数变成生成器
2. 生成器的优点
Python使用生成器对延迟操作提供了支持。所谓延迟操作,是指在需要的时候才产生结果,而不是立即产生结果。这也是生成器的主要优点。
3. 生成器表达式和列表解析式
- 把列表解析的[]换成()得到的就是生成器表达式
- 列表解析与生成器表达式都是一种便利的编程方式,只不过生成器表达式更节省内存
- Python不但使用迭代器协议,让for循环变得更加通用。大部分内置函数,也是使用迭代器协议访问对象的。例如, sum函数是Python的内置函数,该函数使用迭代器协议访问对象,而生成器实现了迭代器协议,所以,我们可以直接这样计算一系列值的和:
sum(x ** 2 for x in xrange(4))
4. 生成器函数总结
- 列表内容语法上和函数类似:生成器函数和常规函数几乎是一样的。它们都是使用def语句进行定义,差别在于,生成器使用yield语句返回一个值,有多少yield就可以返回几次,而常规函数使用return语句返回一个值,只能返回一次
- 自动实现迭代器协议:对于生成器,Python会自动实现迭代器协议,以便应用到迭代背景中(如for循环,sum函数)。由于生成器自动实现了迭代器协议,所以,我们可以调用它的next方法,并且,在没有值可以返回的时候,生成器自动产生StopIteration异常
- 状态挂起:生成器使用yield语句返回一个值。yield语句挂起该生成器函数的状态,保留足够的信息,以便之后从它离开的地方继续执行