使用迭代器
迭代是访问集合元素的一种方式。迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。
可迭代对象
我们已经知道可以对list、tuple、str等类型的数据使用for…in…的循环语法从其中依次拿到数据进行使用,我们把这样的过程称为遍历,也叫迭代,这个数据就是可迭代的。
>>> alist=[1,2,3,4,5]
>>> for ele in alist:
print(ele)
1
2
3
4
5
但是,是否所有的数据类型都可以放到for...in...
的语句中,然后每次从中取出一条数据供我们使用,即供我们迭代吗?
我们可以用isinstance()语句来判断:
>>> isinstance({},Iterable)
True
>>> isinstance('abc',Iterable)
True
>>> isinstance(100,Iterable)
False
返回值为True
的数据为可迭代的,为False
的为不可迭代的。
那么我们要怎样来构造一个迭代器呢?
参考一下python
迭代器协议的定义。
含有 __ iter __() 方法或 __ getitem __() 方法的对象称之为可迭代对象。
因此,我们可以重写__iter__()方法来自定义一个迭代器类。
>>> class MyList(object):
def __init__(self):
self.container = []
def add(self, item):
self.container.append(item)
def __iter__(self):
"""返回一个迭代器"""
# 我们暂时忽略如何构造一个迭代器对象
pass
>>> isinstance(MyList(),Iterable)
True
可以看到MyList类的对象已经是一个可迭代的了。
迭代过程的本质
当然,仅凭上面的代码还是无法进行迭代的。如下:
>>> mylist=MyList()
>>> mylist.add(1)
>>> mylist.add(2)
>>> mylist.container
[1, 2]
>>> for i in mylist:
print(i)
Traceback (most recent call last):
File "<pyshell#14>", line 1, in <module>
for i in mylist:
TypeError: iter() returned non-iterator of type 'NoneType'
错误提示表示没有返回一个迭代器对象,说明我们还需要一个迭代器对象,那么是时候分析迭代的过程了。在数据迭代的过程中,我们存在一个工具来帮我们标记现在遍历的位置,直到数据被迭代完成。这个工具就是我们的迭代器 (Iterator)。可迭代对象的本质就是可以向我们提供一个这样的中间“人”即迭代器帮助我们对其进行迭代遍历使用。
实际上就是,可迭代对象通过__iter__()
方法,向我们提供了迭代器。然后利用迭代器,我们再对对象进行迭代。在for x in something:
语句中,我们首先调用something
的__iter__()
方法来获取到一个该对象的迭代器,而后for循环会调用迭代器的__next__()
方法,获取迭代器的下一个对象,赋值给x。
迭代器
显然,在迭代的过程中,迭代器是必不可少的,同样的我们也可以自定义一个迭代器。python迭代器协议中规定:
迭代器协议(iterator protocol)是指要实现对象的__iter()__ 和 next() 方法(注意:Python3 要实现__next__() 方法),其中,__iter __() 方法返回迭代器对象本身,next() 方法返回容器的下一个元素,在没有后续元素时抛出 StopIteration 异常。
所以,我们需要重写两个方法,一个是__iter__()
,一个是__next__()
方法。并且可迭代对象的__iter__()
方法要返回我们的迭代器。
class MyList(object):
"""自定义的一个可迭代对象"""
def __init__(self):
self.items = []
def add(self, val):
self.items.append(val)
def __iter__(self):
#返回迭代器
myiterator = MyIterator(self)
return myiterator
class MyIterator(object):
"""自定义的供上面可迭代对象使用的一个迭代器"""
def __init__(self, mylist):
self.mylist = mylist
# current用来记录当前访问到的位置
self.current = 0
def __next__(self):
if self.current < len(self.mylist.items):
item = self.mylist.items[self.current]
self.current += 1
return item
else:
raise StopIteration
def __iter__(self):
return self
使用for...in
来测试一下:
mylist = MyList()
mylist.add(1)
mylist.add(2)
mylist.add(3)
for num in mylist:
print(num)
结果为:
1
2
3
其实还可以这样来遍历:
mylist = MyList()
mylist.add(1)
mylist.add(2)
mylist.add(3)
iterator=MyIterator(mylist)
while(1):
try:
a=iterator.__next__()
print(a)
except StopIteration:
break
返回的结果都是一样的,这也说明在for ...in ...
中隐性地调用了迭代器,并且将调用了__next__()
方法赋值给循环元素。