迭代器类型是指Python中通过使用特定的单独方法支持在容器中进行迭代的类型。容器对象要提供迭代支持,必须定义container.iter()方法来返回一个迭代器对象,并且迭代器对象本身需要支持iterator.__iter__()
和iterator.__next__()
,这两者共同组成了迭代器协议。Python 定义了几种迭代器对象以支持对一般和特定序列类型、字典和其他更特别的形式进行迭代。 除了迭代器协议的实现,特定类型的其他性质对迭代操作来说都不重要。
container.iter()
返回一个迭代器对象,该对象需要支持迭代协议。如果容器支持不同的迭代类型,则可以提供额外的方法来专门地请求不同迭代类型的迭代器。 (支持多种迭代形式的对象的例子有同时支持广度优先和深度优先遍历的树结构。) 此方法对应于 Python/C API 中 Python 对象类型结构体的 tp_iter 槽位。
迭代器协议
迭代器协议由iterator.__iter__()
和iterator.__next__()
构成。
iterator.__iter______()
返回迭代器对象本身,实现该方法是同时允许容器和迭代器配合for和in语句使用的必要条件,此方法对 应于 Python/C API 中 Python 对象类型结构体的 tp_iter槽位。
iterator.__next______()
从迭代器中返回下一项,如果已经没有项可返回,则会引发StopInteration异常,此方法对应于 Python/C API 中 Python 对象类型结构体的 tp_iternext槽位。
迭代器协议实现原理
大多数容器都能使用for语句,如下:
>>> for element in [1,2,3]:
print (element)
1
2
3
>>> for element in (1,2,3):
print (element)
1
2
3
>>> for element in {'one':1, 'two':2}:
print (element)
one
two
>>> for char in '123':
print (char)
1
2
3
>>>
以上访问方式清晰、简洁、方便,迭代器的使用渗透并统一了Python,for语句在底层对容器对象调用iter(),函数返回一个迭代器对象,该对象定义方法__next______(),该方法一次访问一个容器中的元素。当没有更多的元素时,__next______()会引发一个stopIteration异常,通知for循环终止。可以使用next()内置函数调用__next______()方法,举例如下:
>>> s = 'abc'
>>> it = iter(s)
>>> it
<str_iterator object at 0x102156828>
>>> next(it)
'a'
>>> next(it)
'b'
>>> next(it)
'c'
>>> next(it)
Traceback (most recent call last):
File "<pyshell#147>", line 1, in <module>
next(it)
StopIteration
以上就是迭代器协议的实现原理,知道迭代器协议实现原理之后,可以给自己的类添加迭代器。首先定义一个__iter______()返回一个带有__next______()方法的对象,如果已经定义了__next______(),则___iter_____