zip是build-in方法
而izip是itertools中的一个方法
这两个方法的作用是相似的,但是具体使用中有什么区别呢?今天来探究一下。
zip
文档中这样描述:
This function returns a list of tuples, where the i-th tuple contains the i-th element from each of the argument sequences or iterables. The returned list is truncated in length to the length of the shortest argument sequence.
就是把多个序列或者是迭代器的元素,组合成元组。返回的元组的长度是所有输入序列中最短的
In [27]: a = ['a', 'b', 'c', 'd', 'e']
In [28]: b = range(10)
In [29]: zip(a,b)
Out[29]: [('a', 0), ('b', 1), ('c', 2), ('d', 3), ('e', 4)]
组合之后的元组长度是依照两个输入序列中最短的a为准的。
如果输入的两个序列都是特别大的情况,zip就会很慢了。使用izip比较下。
In [30]: a = range(10000000)
In [31]: b = range(10000000)
In [32]: tim
%%timeit %time %timeit
In [32]: %timeit(zip(a,b))
1 loops, best of 3: 811 ms per loop
In [33]: import itertools
In [34]: %timeit(itertools.izip(a,b))
1000000 loops, best of 3: 349 ns per loop
这样看izip会快的多。
izip
文档中的描述:
Make an iterator that aggregates elements from each of the iterables. Like zip() except that it returns an iterator instead of a list. Used for lock-step iteration over several iterables at a time.
把不同的迭代器的元素聚合到一个迭代器中。类似zip()方法,但是返回的是一个迭代器而不是一个list。用于同步迭代一次几个iterables
orangleliu: 因为返回的是一个迭代器,并且同步迭代,所以速度比较快。
izip_longest
Make an iterator that aggregates elements from each of the iterables. If the iterables are of uneven length, missing values are filled-in with fillvalue. Iteration continues until the longest iterable is exhausted
也就是说这个zip方法使用izip一样的原理,但是会使用最长的迭代器来作为返回值的长度,并且可以使用fillvalue来制定那些缺失值的默认值
In [35]: a = ['a','b','c']
In [36]: b = range(10)
In [37]: itertools.izip_longest(a,b,fillvalue=-1)
Out[37]: <itertools.izip_longest at 0x250e540>
In [38]: c = itertools.izip_longest(a,b,fillvalue=-1)
In [42]: for i in c:
....: print i
....:
('a', 0)
('b', 1)
('c', 2)
(-1, 3)
(-1, 4)
(-1, 5)
(-1, 6)
(-1, 7)
(-1, 8)
(-1, 9)
探究一下,基本的区别就是这些,具体的使用要看具体的编程场景。