测试环境: python3.4
zip的作用
压缩任意多个[0,N]
参数,形成新的复合元组。
通过几个简单的例子认识zip()
1. 相同长度元组
普通元组
a, b = [0, 1], [2, 3]
ab = zip(a, b)
print(list(ab))
# [(0, 2), (1, 3)]
zip()逆向处理——解压
ab = zip(a, b)
unzip_a, unzip_b = zip(*ab)
print(list(unzip_a) == a and list(unzip_b) == b)
# True
解压表达式zip(* tuple)
,按照zip()的规则拆分元组。
复合元组
c = [4, 5]
ab = zip(a, b)
abc = zip(ab, c)
print(list(abc))
# [((0, 2), 4), ((1, 3), 5)]
如上例,ab已经是一个二元元组,与元组c合并,结果是一个复合形式的新元组,abc的第一个元素是((0, 2), 4)
。
由此可以看出zip()的功能就是将两个元组(或者称为list)的内容按照一一对应的关系组合成新的元组,且保留原先的数据形式。
2. 不等长元组
# 不等长元组
w, x, y, z = [], [1], [2, 3], [4, 5, 6]
xyz = zip(x, y, z)
print(list(xyz))
# [(1, 2, 4)]
wxy = zip(w, x, y)
print(list(wxy))
# []
根据输出结果可知,zip()压缩时以长度最短的元素判断是否结束。
故如果参数中某一元组为空,合并后的结果就是空;如果参数中最小长度为1,合并后的元组长度为1,剩余元组数据丢失。
如果希望按照最大长度合并,缺少内容部分使用None填充,python提供itertools.zip_longest()
方法,示例如下:
# 最大参数长度压缩元组,缺少参数部分使用None占位
import itertools
longest_wxyz = itertools.zip_longest(w, x, y, z)
print(list(longest_wxyz))
# [(None, 1, 2, 4), (None, None, 3, 5), (None, None, None, 6)]
zip()的结果只能使用一次?为什么?
a, b = 'ab', 'cd'
ab_zip_obj = zip(a, b)
print(ab_zip_obj)
# <zip object at 0x0000000003BE0788>
print(list(ab_zip_obj))
# [('a', 'c'), ('b', 'd')]
print(list(ab_zip_obj))
# []
编写过示例代码之后会发现zip()之后的结果只能“使用一次”。如代码示例中所写,第二次使用list(ab_zip_obj))
输出ab_zip_obj
的内容是[]
,这是为什么呢?查看python3提供zip()的源代码,zip()实际上是一个生成器对象,故使用list()
获取zip()结果时,已经相当于是完成一次迭代遍历,第二次再次使用list()
时迭代已经结束,所以返回[]
。
zip的源码实现
def zip(*iterables):
# zip('ABCD', 'xy') --> Ax By
sentinel = object()
iterators = [iter(it) for it in iterables]
while iterators:
result = []
for it in iterators:
elem = next(it, sentinel)
if elem is sentinel:
return
result.append(elem)
yield tuple(result)
以上只是我个人的总结与思考,如果遗漏或不对之处,望大家指出,共同进步,谢谢!