迭代器协议
- 什么是迭代器协议
对象需要提供next方法,它要么返回迭代中的下一项,要么就引起一个StopIteration异常,终止迭代.
- 可迭代对象
实现了迭代器协议的对象就是可迭代对象(实现方式是,实现iter方法)
- 协议
协议是一种规定,可迭代对象实现迭代器协议,Python的内置工具(如for,sum,min,max,in)就可以使用迭代器协议访问对象.例如文件之所以可以被for循环遍历,就是因为文件对象实现了迭代器协议,也就是说它有next()方法.
迭代器
- 定义
就是实现了iter() 和 next()方法的对象.其中iter()返回迭代器本身,而next()返回容器的下一个元素,在结尾处引发StopInteration异常.
it = iter(iterable) # 将一个可迭代对象转换为迭代器
next(it) # 获取下一个迭代器中的下一个值
`注意`
list dic tuple string 并不是迭代器,它们只是可迭代对象.但是可以通过iter(list)的方法
将它们转换为迭代器.
- 为什么list、dict、str等数据类型不是Iterator?
这是因为Python的Iterator对象表示的是一个数据流,Iterator对象可以被next()函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()函数实现按需计算下一个数据,所以Iterator的计算是惰性的,只有在需要返回下一个数据时它才会计算。
Iterator甚至可以表示一个无限大的数据流,例如全体自然数。而使用list是永远不可能存储全体自然数的。
- 自定义迭代器
class Fib(object):
def __init__(self, n):
self.n = n
self.prev = 0
self.curr = 1
self.count = 0
def __iter__(self):
return self
def __next__(self):
value = self.curr
self.prev, self.curr = self.curr, self.prev+self.curr
self.count += 1
if self.count > self.n:
raise StopIteration
return value
f = Fib(10)
print(f.__next__(), f.__next__(), f.__next__()) # 1 1 2
- 总结:
- 所有的iterable都可以通过内置函数iter()转换为iterator
- 迭代器的优点:省内存.它是一种通过延时创建的方式生成一个序列,只有在需要的时候才被创建.
- 迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问结束,只能往前不能后退
- 迭代器有两个基本的方法:iter,text方法
- 内置函数iter(),next(),本质上都是用的对象的iter()和next()方法.
生成器
- 定义
生成器(Generator)是创建迭代器的简单而强大的工具。它们写起来就像是正规的函数,只是在需要返回数
据的时候使用 yield 语句。每次 next()被调用时,生成器会返回它脱离的位置(它记忆语句最后一次执行的位置
和所有的数据值)。
生成器对延迟操作提供了支持.所谓延迟操作,是指在需要的时候才产生结果,而不是立即产生结果。
- 创建方式
生成器表达式
类似于列表推导式,是用()代替了原来的[].生成器返回按需产生结果的一个对象,而不是一次构建一个结果列表
生成器函数
和常规函数定义一样,但是返回语句return被yield语句代替了.yield语句一次返回一个结果,在每个结果中间,挂起函数的状态,以便下次从它离开的地方继续执行.
- 再看生成器
1. 语法上和普通的函数非常相似,都是用def进行定义.唯一的不同是普通的函数是用return返回,而生成器是通过yield语句返回一个值
2.自动实现迭代器协议:对于生成器,Python会自动实现它的可迭代协议,以便用在可以迭代的地方.所以我们可调用它的next方法,获取下一个元素,并且在没有值可以返回的时候,生成器会自动产生StopIteration异常
3.状态挂起:生成器使用yield语句返回一值.yield语句挂起该生成器函数的状态,保留足够的信息,以便之后从它离开的地方继续执行.4.生成器能做到迭代器能做的所有事,而且因为自动创建了 iter()和 next()方法,生成器显得特别简洁,而且生成器也是高效的.