记录这个问题的原因是最近在写UDF函数的时候,涉及到字典的遍历,本地测试ok,但是线上却出了BUG,因此此做一个问题记录。
直接说问题原因:
因为python3.6之前的版本,字典的遍历是无序的,但是python3.6之后的版本遍历顺序跟存储顺序是一致的。
# python 2.7
test_dict = {'1':'a','2':'b','3':'c'}
for i in test_dict:
print i,test_dict[i]
>>>
1 a
3 c
2 b
# python 3.7
test_dict = {'1':'a','2':'b','3':'c'}
for i in test_dict:
print (i,test_dict[i])
>>>
1 a
2 b
3 c
如果只是单纯的遍历字典,顺序当然也无所谓,但是如果是像下图这样使用了zip做数据的拼接,那结果就差别很大了,比如下面这段代码
#python
test_dict = {'1':'a','2':'b','3':'c'}
test_tuple = ('11','22','33')
for i,x in zip(test_dict,test_tuple):
print i,test_dict[i],x
在不同的python版本下,结果是不一样的
在python2.7中,结果为:
1 a 11
3 c 22
2 b 33
在python3.7中,结果为:
1 a 11
2 b 22
3 c 33
这种差异会导致结果完全不同,但是有些时候如果只做简单的测试,很可能恰巧遍历顺序是相同的结果也没有差异,很难发现。
因为是临时的事项,所以也没有考虑本地python环境跟线上python环境差异的问题。当时本地python版本是3.7,线上版本是2.7,出现bug以后检查完才发现是版本跟字典遍历顺序的问题。