迭代器是Python中的一个高级概念,迭代器是一个实现了迭代器协议的对象,那何为迭代器协议呢?

满足下面两个条件就行。(1)该对象实现了__iter__()方法;(2)该对象实现了next()方法,返回当前元素,并指向下一个元素的位置,如果当前位置已无元素,则抛出StopIteration异常。

看下面例子

wKioL1f0uGiATtRcAACLQZmHWiE997.png-wh_50

这说明列表这个对象实现了迭代器协议。如果一个对象有__iter__()方法,那么它就是可迭代对象。可以利用迭代器协议来遍历可迭代对象,例如下面例子:

#coding=utf-8
a = range(3)
it = a.__iter__()
while 1:
    try:
        print it.next()
    except StopIteration:
        break

输出结果:

1

2


其实吧,for语句就是获取了容器的迭代器、调用迭代器的next()方法以及对StopIteration进行处理等流程进行封装了的语法糖,类似的还有in/not in语句。

迭代器的优势有很多:

(1)定义了统一的访问容器的接口,我们可以随时定义自己的迭代器,只要实现了迭代器协议就行。

(2)迭代器有惰性求值的特性,它进可以在迭代至当前元素时才计算,所以非常适合遍历元素非常多的容器,而且更省内存。

看下面例子:

#coding=utf-8
class Fab(object):
    def __init__(self, max):
        self.max = max
        self.n, self.a, self.b = 0, 0, 1

    def __iter__(self):
        return self

    def next(self):
        if self.n < self.max:
            r = self.b
            self.a, self.b = self.b, self.a + self.b
            self.n = self.n + 1
            return r
        raise StopIteration()

for one in Fab(5):
    print one

输出结果如下:

1

2

3

4

5

迭代器使用的内存会更小。看看下面的例子:

print sys.getsizeof(Fab(5))
print sys.getsizeof([1,2,3,4,5])


输出结果如下:

wKiom1f0vn2jacRKAAAaMtP6CdQ048.png-wh_50

同样是获取含有元素1,2,3,4,5的容器,迭代器更省内存。还有一个,看下面例子:

print sys.getsizeof(Fab(5))
print sys.getsizeof(Fab(50))
print sys.getsizeof(Fab(500))
print sys.getsizeof(Fab(5000))

输出结果如下:

wKioL1f0v7iziCTIAAAZsyckEmc810.png-wh_50

占用的内存并没有因为元素的增多而增加,所以在编写代码时要多多使用迭代器或者迭代协议。


Python中内置了一个iter()函数,可以返回一个迭代器对象,它接受的参数是一个实现了__iter__()方法的容器(也就是可迭代对象)或者迭代器。对于有__iter__()方法的容器,__iter__()也返回一个迭代器对象。


python中有itertools模块,里面的函数都是用迭代器实现的,效率很高,有时间你可以去了解下。