Python生成器、迭代器
一、生成器(generator)
通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。当生成器所有的元素被调用完后再使用next()函数会抛出StopIteration异常。
要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:
data = (x*x for x in range(10))
print(type(data))
# <class 'generator'>
第二种通过yield来创建生成器
def fibonacci(n):
a, b, counter = 0, 1, 0
while True:
if (counter > n):
break
yield a
a, b = b, a + b
counter += 1
f = fibonacci(10)
print(type(f))
data = []
while True:
try:
data.append(next(f))
except StopIteration:
break
print(data)
#<class 'generator'>
#[0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55]
二、迭代器(Iterator)
迭代器概述
可以直接作用于for循环的数据类型有以下几种:
一类是集合数据类型,如list,tuple,dict,set,str等;
另一类是generator ,包括生成器和带yeild的generator function,
这些可以 直接作用于for循环的对象统称为可迭代对象:Iterable,
可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator,
list,dict,str虽然是Iterable,却不是Iterator。
生成器就是特殊的迭代器。
迭代器可以使用next()、iter()或者.next()、.iter()函数。
data = [1,2,3]
# 使用iter()函数使列表由可迭代对象变成迭代器
it = iter(data)
print(type(it))
# <class 'list_iterator'>
#next(data)
# TypeError: 'list' object is not an iterator
print(next(it))
# 1
print(next(it))
# 2
print(next(it))
# 3
print(next(it))
# StopIteration