当需要处理一个无限的序列,或是一个需要大量处理计算的数据,可能列表和集合不能胜任的时候,我们就可以考虑使用生成器来完成。恰当的使用生成器可以节省大量内存。
1. 生成器语法
一般生成器都是由一个或多个yield语句生成的函数,注意生成器是一个函数,且不是return返回。看下面一个简单的生成器:
def base_generator():
yield 1
yield 2
yield 3
这个生成器,在yield了三次,代表能返回三次值,分别是1,2,3。我们用for循环下:
for i in base_generator():
print(i)
输出
1
2
3
每次循环的时候,生成器就返回一个yield。
2. 读取生成器
读取生成器一般有两种方式,一种就是上面使用过的for循环,还有一种是next()函数,我们用next()函数再重新读取下上面的base_generator生成器。
b = base_generator()
print(next(b))
print(next(b))
print(next(b))
输出
1
2
3
两种读取方式都是在每次需要取值时执行base_generator生成器函数,但不会从头执行,而是从执行上次yield位置后执行。在执行完最后个yield后,一个生成器就完成了,如我们在上面代码的后再执行print(next(b))就会报StopIteration错。
3. 生成器的简单应用
最经典的生成器应用就是斐波那契数列:1 1 2 3 5 8......就是后一个数是前两个数的和,我们写一个斐波那契数列的生成器。
def fibonacci():
# 缓存数列
numbers = []
while True:
if len(number) < 2:
# 前两个数是不计算,直接输入1
numbers.append(1)
else:
# 第三个数起,生成前两个数之和添加到数列中
numbers.append(sum(numbers))
# 因为我们只要求输入当前数,数列中只保存两个数就可以
# 每次生成一个数后把最前的一个数去掉,保证缓存数列里就两个当前数
numbers.pop(0)
# 返回数列中的最后一个数
yield numbers[-1]
我们没有条件限制while True,所以这个斐波那契数列生成器是无限的,而且当且仅当我们需要下一个值时,生成器才会计算,生成器相对于列表和集合的优势就在于此。
4. 生成器的交互
以上我们使用过的生成器都是单向生成的,它不会后退,也不会跳越生成。那我们能不能根据需求取得生成器的值呢?答案是确定的,我们可以用传参,再通过send方法来实现。看以下的例子:
def squares(cursor=1):
while True:
response = yield cursor ** 2
if response:
cursor = int(response)
else:
cursor += 1
该生成器是生成自然数的平方值,通过一个默认为1的cursor参数传值。我们先看它的用例:
squ = squares()
print(next(squ))
print(next(squ))
print(next(squ))
print(squ.send(8))
print(next(squ))
输出:
1
4
9
64
81
当我们使用squ.send(8)时,生成器发生了什么?
response = yield cursor ** 2
8传参给了cursor,yield表达式先return把8 ** 2返回,还会再把8赋给了response。接下来cursor就会变成8,生成器从8往后迭代了。
真实使用中,因为需求取得生成器的值,但是不想改变生成器原来的顺序,这种方式也是可以实现的,看如下生成器:
def _squares_(cursor=1):
response = None
while True:
if response:
response = yield response ** 2
continue
response = yield cursor ** 2
cursor += 1
仔细理解其中的意思,我们看看它的输出:
squ = _squares_()
print(next(squ))
print(next(squ))
print(next(squ))
print(squ.send(8))
print(next(squ))
输出:
1
4
9
64
16