生成器和 yield 语句
在 Python 中,生成器(Generators)是一种特殊的迭代器,它们由一类特殊的函数——生成器函数(Generator Functions)返回。生成器函数与普通函数的主要区别在于,生成器函数使用 yield
语句而不是 return
语句来返回序列中的元素。
生成器的基本概念
生成器允许我们定义更复杂的迭代,利用 Python 解释器的特性。生成器不使用对象的属性来跟踪它们在序列中的进度,而是控制生成器函数的执行,每次调用生成器的 __next__
方法时,函数会运行直到执行下一个 yield
语句。
生成器函数的定义
生成器函数使用 yield
语句来返回序列中的元素。每次调用生成器的 __next__
方法时,生成器函数会从上次暂停的地方继续执行,直到遇到下一个 yield
语句。
示例:字母生成器
下面是一个简单的字母生成器示例:
def letters_generator():
current = 'a'
while current <= 'd':
yield current
current = chr(ord(current) + 1)
for letter in letters_generator():
print(letter)
输出结果:
a
b
c
d
在这个示例中,letters_generator
是一个生成器函数。它从字母 ‘a’ 开始,每次生成一个字母,直到 ‘d’ 为止。yield
语句用于返回当前字母,并在下一次调用 __next__
方法时从上次暂停的地方继续执行。
生成器的执行过程
- 初始化生成器:当调用
letters_generator()
时,它返回一个生成器对象,但不会立即执行函数体中的代码。 - 第一次调用
__next__
:第一次调用生成器对象的__next__
方法时,函数体中的代码开始执行,直到遇到第一个yield
语句。此时,函数暂停并返回current
的值 ‘a’。 - 后续调用
__next__
:每次调用__next__
方法时,函数从上次暂停的地方继续执行,直到遇到下一个yield
语句。current
的值会更新,并返回新的值。 - 停止迭代:当
current
的值超过 ‘d’ 时,函数会停止执行,生成器对象会抛出StopIteration
异常。
手动调用 __next__
方法
我们可以手动调用生成器对象的 __next__
方法来遍历生成器:
letters = letters_generator()
print(type(letters)) # <class 'generator'>
print(letters.__next__()) # 'a'
print(letters.__next__()) # 'b'
print(letters.__next__()) # 'c'
print(letters.__next__()) # 'd'
print(letters.__next__()) # 抛出 StopIteration 异常
生成器的优势
生成器的优势在于它们能够以一种更简洁和高效的方式处理复杂的迭代逻辑。生成器函数在每次迭代时只生成一个值,而不是一次性生成整个序列,这使得它们在处理大数据集时更加节省内存。
拓展:生成器的应用场景
生成器在以下场景中特别有用:
- 处理大数据集:生成器可以逐个生成数据,避免一次性加载整个数据集到内存中。
- 无限序列:生成器可以生成无限序列,例如斐波那契数列。
- 惰性计算:生成器支持惰性计算,只在需要时生成数据,提高程序的效率。