今天看书的时候,书上说在对列表进行for循环时,不要直接对其进行删除,添加操作,会出现意想不到的问题,就好比"如果要数一个罐子中的糖豆数量时候,同时有人向其中添加糖豆或者从中取出糖豆,要数清罐子中的糖豆会有多难".
于是我就做了一个实验:
my_list = [1, 2, 3, 4]
for i in my_list:
my_list.remove(i)
print(my_list)
print("此时列表为", my_list)
结果是:
[2, 3, 4]
[2, 4]
此时列表为 [2, 4]
------------------
(program exited with code: 0)
请按任意键继续. . .
我擦, 按常理来说,应该全删了才对,为啥2,4没删掉?没那么简单
于是我去网上看了看for循环的原理:
可能有人不经要问,为什么这么多不同类型对象都支持 for 语句,还有哪些类型的对象可以作用在 for 语句中呢?回答这个问题之前,我们先要了解 for 循环背后的执行原理。
for 循环是对容器进行迭代的过程,什么是迭代?迭代就是从某个容器对象中逐个地读取元素,直到容器中没有更多元素为止。
那么,哪些对象支持迭代操作?任何对象都可以吗?先随便自定义一个类试试,看行不行:
>>> class MyRange:
... def init(self, num):
... self.num = num
...
>>> for i in MyRange(10):
... print(i)
...
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'MyRange' object is not iterable
错误堆栈日志非常清楚地告诉我们,MyRange 不是一个可迭代对象,所以它不能用于迭代,那么到底什么样的对象才称得上是可迭代对象(iterable)呢?
可迭代对象需要实现iter方法,并返回一个迭代器,什么是迭代器呢?迭代器只需要实现 next方法。现在我们就来验证一下列表为什么支持迭代:
>>> x = [1,2,3]
>>> its = x.iter() # x有此方法,说明列表是可迭代对象
>>> its
<list_iterator object at 0x100f32198>
>>> its.next() # its有此方法,说明its是迭代器
1
>>> its.next()
2
>>> its.next()
3
>>> its.next()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
从试验结果来看,列表是一个可迭代对象,因为它实现了 iter方法,并且返回了一个迭代器对象(list_iterator),因为它实现了 next方法。我们看到它不断地调用next方法,其实就是不断地迭代获取容器中的元素,直到容器中没有更多元素抛出 StopIteration 异常为止。
那么 for 语句又是如何循环的呢?到这里,恐怕你也猜到了,它的步骤是:
-
先判断对象是否为可迭代对象,不是的话直接报错,抛出TypeError异常,是的话,调用 iter方法,返回一个迭代器
-
不断地调用迭代器的next方法,每次按序返回迭代器中的一个值
-
迭代到最后,没有更多元素了,就抛出异常StopIteration,这个异常 python 自己会处理,不会暴露给开发者
-
我的理解(也可以说跟着学一遍),如 for i in my_list,就是先判断"my_lsit"是否为可迭代对象,如果不是就抛出异常(此处对象是一个列表不会报错),是的话就调用其iter方法,返回一个迭代器,这个迭代器把本身的元素按照顺序一个一个排列好,然后开始调用next方法 ,逐个返回元素给"i",直到在次调用next方法时,发现下一个位置没有元素了,就退出循环了
原来是这样,next方法着重元素顺序,不关心其内容,比如,第一次调用next方法,将第一个元素返回后,再次调用next方法,它的着重点就自然地放在“第二个位置上”,这个它不妨命名为“指针”,哪怕原本第二个位置上的元素已经被换掉了,我也不管,我只关心我本次调用时,这个位置上的元素是谁,然后,再任你怎么改动,下一次我还是去我应该去的“第三个位置”
这下不难理解代码了,
my_list = [1, 2, 3, 4]
for i in my_list:
my_list.remove(i)
print(my_list)
print("此时列表为", my_list)
[2, 3, 4]
[2, 4]
此时列表为 [2, 4]
------------------
(program exited with code: 0)
请按任意键继续. . .
my_list返回一个迭代器,第一次循环时(也就是第一次调用next方法),此时my_list第一个位置的元素是1,指针将1返回给i, 循环体内,删除1元素,此时重点,删除后列表会自动地把剩下的元素向前推进,即2成为了第一个位置,3成为了第二个位置,4为第三个位置,然后打印列表,是删除1后的列表,没问题;接着继续调用next方法,指针来到了第二个位置,而此时第二个位置的元素是3,接着删除了3,4向前推进了一格,打印剩下的2和4,没问题;然后在调用next方法时,指针来到了第三个位置,可是此时列表已经没有第三个位置的元素了,指针返回了一个异常StopIteration,触发了for循环的退出机制,接着列表就还剩下2和4,哈哈,这下舒服了
我又测试了一下在循环列表时添加元素:
my_list = [1, 2, 3, 4]
for i in my_list:
my_list.append(i)
print(my_list)
print("此时列表为", my_list)
结果是死循环,不过也不难理解了,每次调用next方法时,指针向下一个位置移动,但是此时会在最后添加一个元素,即又多了一个位置,你向下移动一个位置,我就增加一个位置,这肯定退出不了哦!
最后,明白了一个技巧,就是当需要循环删除或添加元素时,将列表的切片作为迭代对象,然后在循环体里对原列表进行改动:
my_list = [1, 2, 3, 4]
for i in my_list[:]:
my_list.remove(i)
print(my_list)
print("此时列表为", my_list)
结果:
[2, 3, 4]
[3, 4]
[4]
[]
此时列表为 []
------------------
(program exited with code: 0)
请按任意键继续. . .
完美!