初学Python,看到zip()函数的用法介绍,想着简单试验一下,结果却发现和预想的结果大相径庭。
a = [1, 2, 3]
b = [222, 333, 444]
c = [33333, 44444, 55555]
zipped = zip(a, b, c)
print(list(zipped))
print("---")
#由于list()函数的实现 需要用尽迭代器
#而zip也是同理,因此一旦list()使用了zipped的迭代器,再交给zip()函数就得不到任何元素。
unzipped = zip(*zipped)
print(list(unzipped))
输出结果:
[(1, 222, 33333), (2, 333, 44444), (3, 444, 55555)]
---
[]
按照我原本的浅显理解,第一次输出打包后的list,第二次输出解包后的list才对。然而实际运行过程中第二次不能正确输出。而且,将list(zipped)
去掉之后,第二次就能正确输出了。
经过学习发现其实问题在于list()函数和zip()函数都是将可迭代对象作为参数,将迭代器耗尽后得到结果。所以不只是list(zipped)
,如果写成for x in zipped:...
结果也是一样的,问题在于将一个迭代器对象多次使用。
虽然不知道CPython中zip类的具体实现,但也可以猜到大概也是__iter__
返回本身的那种实现吧。对于普通的可迭代对象(Iterable),方法内部通过__iter__
获取的迭代器(Iterator)一般是全新的,这大概也就是为什么同一个tuple、list对象可以被多次用于可迭代对象参数(它们都不是Iterator)。
而zip对象则是Iterator,大概每次通过__iter__
调用得到的都是这个迭代器本身,所以不能重复地使用吧。
其实说到底这是对Python可迭代对象、迭代器这些概念的理解程度的问题。希望我的经历能帮到读者!