在操作两个数据集的时候,进行去重操作:
比如对数据集进行合并
具体的代码如下:
# *===================================*
# -*- coding: utf-8 -*-
# * Time : 2019-11-10 22:06
# * Author : zhangsf
# *===================================*
#将两部分的list数据汇总key相同的部分合并一下,保证最终导入到Excel表中的key唯一
def MergeData(data):
empty_dict = dict()
for d in data:
a=list(d[1])
#判断字典中是否存在key存在就更新value,否则添加k-v
if(empty_dict.__contains__(d[0])):
empty_dict[d[0]][0] = empty_dict[d[0]][0] +a[0]
empty_dict[d[0]][1] = empty_dict[d[0]][1] + a[1]
empty_dict[d[0]][2] = empty_dict[d[0]][2] + a[2]
empty_dict[d[0]][3] = empty_dict[d[0]][3] + a[3]
empty_dict[d[0]][4] = empty_dict[d[0]][4] + a[4]
else:
empty_dict[d[0]]=list(d[1])
print(empty_dict)
data1=['key1',(1,0,0,1,0)]
data2=['key2',(0,1,0,0,1)]
data3=['key1',(0,1,0,0,1)]
data=[data1,data2,data3]
#变换之前的data
print("变换之前的data")
print(data)
#变换之后的data
print("变换之后的data")
MergeData(data)
最终的效果: