迭代器和生成器
迭代器是实现了迭代器协议的对象。
- Python中没有像
protocol
或interface
这样的定义协议的关键字。 - Python中用魔术方法表示协议。
__iter__
和__next__
魔术方法就是迭代器协议。
class Fib(object):
"""迭代器"""
def __init__(self, num):
self.num = num
self.a, self.b = 0, 1
self.idx = 0
def __iter__(self):
return self
def __next__(self):
if self.idx < self.num:
self.a, self.b = self.b, self.a + self.b
self.idx += 1
return self.a
raise StopIteration()
在 Python 中,实现了 __iter__
和 __next__
方法的对象称为迭代器,遵循迭代器协议。这两个方法的作用如下:
__iter__
:返回迭代器对象本身。这通常意味着在迭代器类中,__iter__
方法返回self
。__next__
:返回下一个值。如果没有更多的值可返回,则应该引发StopIteration
异常。
使用迭代器
一旦定义了迭代器类并创建了迭代器对象,可以使用以下两种方式来迭代它:
- 显式调用
__next__
方法:print(my_iter.__next__()) # 输出 0 - 使用
next()
内置函数:print(next(my_iter)) # 输出 0 - 在
for
循环中使用: -
for value in MyIterator(5): print(value) # 依次输出 0, 1, 2, 3, 4
生成器是语法简化版的迭代器。
def fib(num):
"""生成器"""
a, b = 0, 1
for _ in range(num):
a, b = b, a + b
yield a
生成器进化为协程。
生成器对象可以使用send()
方法发送数据,发送的数据会成为生成器函数中通过yield
表达式获得的值。这样,生成器就可以作为协程使用,协程简单的说就是可以相互协作的子程序。
def calc_avg():
"""流式计算平均值"""
total, counter = 0, 0
avg_value = None
while True:
value = yield avg_value
total, counter = total + value, counter + 1
avg_value = total / counter
gen = calc_avg()
next(gen)
print(gen.send(10))
print(gen.send(20))
print(gen.send(30))
value = yield avg_value
:yield
表达式的作用是暂停生成器并返回 avg_value
给调用者,同时等待外部通过 send
方法发送一个新值,这个新值会被赋值给 value
。
这个生成器通过 yield
表达式接收新值,并根据这些值实时计算并返回平均值。这种设计可以高效地处理流式数据,并在每次接收到新值时更新并返回最新的平均值。