对于如下的for语句
for obj in iterable_obj:
do something with obj
首先会调用iter方法获取关于iterable_obj对象的迭代器,然后不断调用迭代器对象的next方法,直至抛出异常位置。
为了说明这一点,看下面的例子。
myiter = MyIterator(1, 4)
for i in myiter:
pass
print myiter.next()
上面代码会抛出StopIteration异常。因为在for语句阶段会将myiter迭代器对象的元素全部读完。MyIterator类的定义参见博文。
到目前位置,我们有三种方式表示一个序列。它们是集合,序列对象和迭代器对象。
- 集合(如列表,元组,字符串等)中的元素可读可写。当然不同的集合类型,可写的权限有所不同。例如列表中的元素可以随意添加,删除,修改。而元组中的元素虽然不能添加、删除和修改,但是我们可以对两个元组对象进行连接。当然,连接后会创建新的元组对象。
- 序列对象中的元素可读但不可写。在基本的定义中,两个序列对象也不必支持元组对象那样的连接操作。这样的好处是,在有的情况下,我们不必开辟专门的内存空间保存序列对象中的所有元素。
- 迭代器对象中的元素也是可读不可写的。但是,迭代器对读的权限做了一个限制,就是只能从头至尾读一遍。迭代器对象的优势在于它有的时候比序列对象更加灵活。通常情况下,序列对象中的元素顺序是不能变的。而对于迭代器对象来说,我们只需要指定不同的next方法,就能实现不同的读取顺序。一个比较经典的例子,就是我们可以实现一个迭代器类,同时支持树的深度优先和广度优先遍历。显然用迭代器实现这个功能比用序列来实现要简单许多。