生成器:一边循环一边计算的机制称为生成器。(generator)
创建生成器的方法很简单,把一个列表生成式的[]改为()就创建了一个generator:
>>> L = [x * x for x in range(10)]
>>> L
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
>>> g = (x * x for x in range(10))
>>> g
<generator object <genexpr> at 0x1022ef630>
另外一种方法为在函数定义中包含yield关键字,则为生成器。
def fib(max):
n, a, b = 0, 0, 1
while n < max:
yield b
a, b = b, a + b
n = n + 1
return 'done'
生成器执行时遇到yield语句返回,调用next()的时候执行,再次执行时从上次返回的yield语句处继续执行。
举例如下:
def odd():
print('step 1')
yield 1
print('step 2')
yield(3)
print('step 3')
yield(5)
结果为
>>> o = odd()
>>> next(o)
step 1
1
>>> next(o)
step 2
3
>>> next(o)
step 3
5
迭代器:可以直接作用于for循环的对象称为可迭代对象(Iterable)
可以使用isinstance()判断一个对象是否是Iterable对象
迭代器指可以被next()函数调用并不断返回下一个值的对象
生成器都是iterable对象,但列表、字典、字符串虽然是iterable,却不是迭代器
iterable(可迭代对象)可以通过iter()函数变成iterator(迭代器)。
那么为什么列表、字典、字符串等数据类型不是迭代器?
这是因为python的迭代器对象表示的是一个数据流,迭代器对象可以被next()函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。可以把这个数据流看做一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()函数实现按需计算下一个数据。迭代器甚至可以表示为一个无限大的数据流,例如全体自然数。而使用list是永远不可能存储全体自然数的。