在过去,当我在一个紧缩的循环中需要类似数组的索引查找时,我通常使用元组,因为它们似乎通常是非常好的(接近使用n个变量)。不过,我今天决定质疑这个假设,并提出了一些令人惊讶的结果:
In [102]: l = range(1000)
In [103]: t = tuple(range(1000))
In [107]: timeit(lambda : l[500], number = 10000000)
Out[107]: 2.465047836303711
In [108]: timeit(lambda : t[500], number = 10000000)
Out[108]: 2.8896381855010986
元组查找似乎比列表查找长17%!重复实验得到了类似的结果。我们发现两者都是:
In [101]: dis.dis(lambda : l[5])
1 0 LOAD_GLOBAL 0 (l)
3 LOAD_CONST 1 (5)
6 BINARY_SUBSCR
7 RETURN_VALUE
作为参考,典型的10,000,000全局变量查找/返回需要2.2s。另外,我没有羔羊跑了,你知道,万一(注意,这个数字是100,000,000而不是10,000,000)。
In [126]: timeit('t[500]', 't=range(1000)', number=100000000)
Out[126]: 6.972800970077515
In [127]: timeit('t[500]', 't=tuple(range(1000))', number=100000000)
Out[127]: 9.411366939544678
在这里,元组查找耗时35%。这里发生了什么?对于非常紧张的循环,这实际上似乎是一个重大的差异。可能是什么原因造成的?
请注意,对于分解为变量(例如x,y = t),元组稍快(在我的少数测试中少于6%的时间),并且从固定数量的参数构造,元组更快(减少约83% )。不要把这些结果作为一般规则;我刚刚进行了一些对大多数项目来说毫无意义的minitests。
In [169]: print(sys.version)
2.7.1 (r271:86882M, Nov 30 2010, 09:39:13)
[GCC 4.0.1 (Apple Inc. build 5494)]