迭代器 (Iterators)
迭代器是一个对象,它实现了两个魔术方法,__iter__()
和 __next__()
。它们使对象能够在 for
循环中使用。
__iter__()
返回迭代器对象本身。__next__()
返回容器中的下一个值。如果容器中没有更多的项,它应该抛出StopIteration
异常。
示例:
class Counter:
def __init__(self, low, high):
self.current = low
self.high = high
def __iter__(self):
return self
def __next__(self):
if self.current > self.high:
raise StopIteration
else:
self.current += 1
return self.current - 1
c = Counter(5, 10)
for number in c:
print(number)
Python 的内置数据结构如列表、元组等都是可迭代的。当你在这些结构上使用 iter()
函数时,它返回一个迭代器,该迭代器定义了访问容器内容的方式。
生成器 (Generators)
生成器是一种特殊类型的迭代器,更简洁且更便于使用。与迭代器相比,生成器的创建不需要实现 __iter__()
和 __next__()
方法。相反,你只需要使用一个函数,该函数包含一个或多个 yield
语句。
- 当调用一个生成器函数时,它返回一个生成器对象,但不立即执行函数。
- 当
__next__()
被调用时,函数从上次暂停的地方开始执行,直到遇到yield
语句。
示例:
def counter(low, high):
while low <= high:
yield low
low += 1
for number in counter(5, 10):
print(number)
除了上述的生成器函数,你还可以使用生成器表达式创建生成器,这与列表推导式类似,但使用圆括号而非方括号。
squared_numbers = (x*x for x in range(5))
for num in squared_numbers:
print(num)
总结:
- 迭代器和生成器都允许你迭代数据,但生成器更为简洁,并且更易于编写和理解。
- 生成器是懒惰的,这意味着它们仅在需要时才生成值,这在处理大数据集时很有用,因为你不需要在内存中存储所有的值。
- 迭代器和生成器都是一次性使用的,这意味着一旦你迭代过它们,你不能重新开始或回退(除非你重新创建迭代器或生成器)。