关于这两几个概念,前后看了很多次,终于有些明白了,在这里做个总结!
一、涉及到的内置方法
__iter__()
可迭代对象都具有该方法,该方法返回的是当前对象(实例本身就是迭代对象: return self )
__next__()
返回迭代的每一步,实现该方法时注意要最后超出边界要抛出StopIteration异常
from collections import Iterable, Iterator
a_list = [1, 2, 3]
print('a_list 是可迭代器吗? ', isinstance(b, Iterator))
a_list_iterator = iter(a_list) # 创建迭代器对象
print(a_list_iterator.__next__())
print(a_list_iterator.__next__())
print(a_list_iterator.__next__())
print(a_list_iterator.__next__())
>>>
a_list 是可迭代器吗? False
1
2
3
Traceback (most recent call last):
File "E:/test python/iterator_test.py", line 59, in <module>
print(a_list_iterator.__next__())
StopIteration
二、可迭代对象
实现了__iter__方法,称为可迭代对象,像list、dict对象,但不一定有__next__方法。
from collections import Iterable, Iterator
b = [x+1 for x in range(0, 5)]
c = iter(b) # 返回迭代器
print type(c)
print 'b 是可迭代对象', isinstance(b, Iterable)
print 'b 是可迭代器', isinstance(b, Iterator)
print 'c 是可迭代器', isinstance(c, Iterator)
>>>
<type 'listiterator'> # 列表类型迭代器
b 是可迭代对象 True
b 是可迭代器 False
c 是可迭代器 True
那有人问了,不具有__next__方法,为什么for循环可以输出呢?
因为处理这些数据前,for循环会调用 __iter__() 方法,将这些数据转化为一个迭代器,然后依次调用__next__(),并处理StopIteration异常, 实现for循环。
三、迭代器
实现了__iter__和__next__方法,迭代器一定是可迭代对象,是一个可以记住遍历的位置的对象,它从集合的第一个元素开始访问,直到所有的元素被访问完结束,只能往前不会后退。
四、生成器
特殊的迭代器,yield关键字可返回一个迭代器,包括值和状态,生成器终结时,还会自动抛出 StopIteration 异常
生成器函数:利用关键字yield一次返回一个结果,并在下一次执行 next() 方法时从当前位置继续运行
生成器表达式:返回一个对象,这个对象只有在需要的时候才产生结果
缺点:因为是惰性计算,所以它并不知道序列中有多少元素,也不知道下个元素是什么,每次执行next方法才会产生下一个元素。
优点:按要求返回一个对象,而不是构建一个列表,从而节约了内存空间。
"""生成器函数"""
def iterator_test():
for i in range(10):
yield i
a = iterator_test()
print a.next() # 记录了状态
print a.next()
>>>
0
1
"""生成器表达式"""
a = (i+1 for i in range(5))
print a
print type(a)
>>>
<generator object <genexpr> at 0x0000000003676D80>
<type 'generator'>
生成器与迭代器的区别:生成器可以自动创建了 iter()和 next()方法,特别简洁,使用生成器表达式取代列表解析可以同时节省内存。