可迭代对象
>>> r = range(10)
>>> r.__iter__
<method-wrapper '__iter__' of range object at 0x000002011137C2A0>
可迭代对象都有这么一个方法,有__iter__的对象叫可迭代对象。
可迭代对象可以出现在for in语句里,或者说 for in 语句需要可迭代对象。
for x in range(10):
pass
迭代器
目前为止,一共学习了7种数据结构:
- list
- tuple
- str
- bytes
- byte_array
- dict
- set
而迭代器是可迭代对象
>>> it = iter(range(5))
>>> it.__next__
<method-wrapper '__next__' of range_iterator object at 0x0000020111786D30>
有__next__方法的可迭代对象叫迭代器
其中list是没有的:
>>> list.__next__
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: type object 'list' has no attribute '__next__'
k = {}.keys()
也没有
>>> k = {}.keys()
>>> k
dict_keys([])
>>> k.__next__
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'dict_keys' object has no attribute '__next__'
目前学的所有类型都不是迭代器
但是可迭代对象可以转化为迭代器
iter函数可以把一个可迭代对象转化为迭代器
为什么要转换呢?
因为迭代器可以使用next()方法,就可以从迭代器里取出下一个元素。
>>> next(iter(range(5)))
0
>>> next(iter(range(5)))
0
这里一直是0的原因是因为,在不断的next一个每次都会初始化的迭代器range。
可迭代对象并不是迭代器,必须要有next方法的,才称为迭代器。
迭代器就既有next方法,又有iter方法。
迭代器会保存一个指针,指向可迭代对象的当前元素。
当前指针是指向it的头,当调用到it的时候,返回当前元素并指向下一个:
>>> it = iter(range(5))
>>> it
<range_iterator object at 0x0000020111786DF0>
>>> next(it)
0
>>> next(it)
1
#当没有下一个元素时,会抛出StopIteration的异常
>>> next(it)
4
>>> next(it)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
应用
比如下面的列表,约定第一个元素是key,后面无论有多少个元素都是值:
lst = [['kidult', 1, 2, 3, 4],['smart', 1, 2, 3]]
#通常做法:
for x in lst:
key = x[0]
for v in x[1:]:
print(v)
#使用迭代器:
>>> for x in lst:
... it = iter(x)
... key = next(it)
... for v in it:
... print(v)
...
1
2
3
4
1
2
3
结果相同,而使用迭代器所占用的内存小,因为前者使用了切片操作,切片操作会复制一份新的内存出来,而后者只是不断的next。
for…in
用iter实现一个for in循环:
it = iter(iterable)
while True:
try:
next(it)
except StopIteration:
pass
- 先调用iter方法,将遍历对象转化为迭代器
- 不断地调用next方法,等于每一次的循环,都先next了以下遍历对象,所有会在每次循环里拿到遍历对象的下级对象
- 直到抛出StopIteration异常,抛出后做异常处理,直接退出。
总结
还是努力就可以了呀,今天算是完成了小目标。加油!