作者:强哥
链接:https://www.zhihu.com/question/24807364/answer/402003110
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
生成器是种特殊的迭代器,所以要理解生成器还得从容器开始说起。
容器(container)
像列表(list)、集合(set)、序列(tuple)、字典(dict)都是容器。简单的说,容器是一种把多个元素组织在一起的数据结构,可以逐个迭代获取其中的元素。容器可以用in来判断容器中是否包含某个元素,如
'a' in {'a', 'b', 'c'} # 输出 True
'a' in {'a': 1, 'b': 2} # 输出 True
'a' in set(['a', 'b', 'c']) # 输出 True
大多数的容器都是可迭代对象,可以使用某种方式访问容器中的每一个元素。
迭代器(iterator)
实现了__iter__和__next__方法的对象都称为迭代器。迭代器是一个有状态的对象,在调用next() 的时候返回下一个值,如果容器中没有更多元素了,则抛出StopIteration异常。
看下面的例子
a = ['a', 'b', 'c']
it = a.__iter__()
print(next(it))
print(next(it))
print(next(it))
print(next(it))
输出
a
b
c
Traceback (most recent call last):
File "/tmp/a.py", line 19, in <module>
print(next(it))
StopIteration
为更好地理解迭代器的内部运行机制,我们再来看一个斐波那契数列的例子
class Fib:
def __init__(self):
self.prev = 0
self.curr = 1
def __iter__(self):
return self
def __next__(self):
self.curr, self.prev = self.prev + self.curr, self.curr
return self.curr
fib = Fib()
for i in range(10):
print(next(fib))
输出
1
1
2
3
5
8
13
21
34
55
只要不断地调用next() 方法,上面的生成器可以生成一个无限长的斐波那契数列。
迭代器是一种Lasy Load的模式,只有在调用时才生成值,没有调用的时候就等待下一次调用。
生成器和yield
生成器其实是一种特殊的迭代器,但是不需要像迭代器一样实现__iter__和__next__方法,只需要使用关键字yield就可以。
我们来实现一个同样的斐波那契数列,但这次使用的是生成器
def fib():
prev, curr = 0, 1
while True:
yield curr
curr, prev = prev + curr, curr
f = fib()
for i in range(10):
print(next(f))
输出
1
1
2
3
5
8
13
21
34
55
上面的 fib 函数中没有 return 关键字。当运行 f = fib() 的时候,它返回的是一个生成器对象。在调用 fib() 的时候并不会运行 fib 函数中的代码,只有在调用 next() 的时候才会真正运行其中的代码。使用生成器,函数不用一次性生成所有的元素,只需在每次调用next的时候生成元素,这样更节省内存和CPU。