工作中遇到以下小问题,解决方法如下,可能比较暴力,暂时留档,再进行优化。
要求:将列表中json的 ‘id’ 字段值相同的数据,根据 type的值,按照一定的优先级次序排列,列表中仅保留优先级最高的type。
(这个问题完全可以不指定优先级,即,找出字典列表中,id相同,type值最大的数据,稍微修改即可)
测试用例:
list1 示例数据:
type优先级列表:[6, 4, 2, 5, 8, 3, 7, 1] (依次递减,6优先级最高,1优先级最低)
draw_data = [
{'geometry':{"coordinates":[121.87635833333333, 30.86567777777778]},"properties":{'type':'6'}, "id": "03N3211"},
{'geometry':{"coordinates":[121.87635833333333, 30.86567777777778]},"properties":{'type':'8'}, "id": "03N3211"},
{'geometry':{"coordinates":[121.87635833333333, 30.86567777777778]},"properties":{'type':'3'}, "id": "09N1111"},
{'geometry':{"coordinates":[121.87635833333333, 30.86567777777778]},"properties":{'type':'2'}, "id": "03N3211"},
{'geometry':{"coordinates":[121.87705277777778, 30.86705]}, "properties": {'type': '2'}, "id": "01N2234"}
]
以上结果应该为:
[
{'geometry': {'coordinates': [121.87635833333333, 30.86567777777778]}, 'properties': {'type': '6'}, 'id': '03N3211'},
{'geometry': {'coordinates': [121.87635833333333, 30.86567777777778]}, 'properties': {'type': '3'}, 'id': '09N1111'},
{'geometry': {'coordinates': [121.87705277777778, 30.86705]}, 'properties': {'type': '2'}, 'id': '01N2234'}
]
def removeduplicate(self, list1, priority=None):
"""
列表套字典去重复, 筛选相同组串id优先级最高的类型
:param list1: 输入一个有重复值的列表
:priority : 优先级列表
:return: 返回一个去掉重复的列表
"""
sort_dict = {'6': 100, '4': 99, '2': 98, '5': 97, '8': 96, '3': 95, '7': 94, '1': 93} # self.types 颜色表按优先级排序
newlist = []
print("list1:", list1)
for ind_i, i in enumerate(list1): # 先遍历原始字典
flag = True
if newlist == []: # 如果是空的列表就不会有重复,直接往里添加
pass
else:
for ind_j, j in enumerate(newlist):
j_id = j['id']
if j_id == i['id']: # 相同id
if sort_dict[j['properties']['type']] <= sort_dict[i['properties']['type']]:
newlist[ind_j] = i
else:
flag=False
else: # 不相等,id可能已经出现过
for ind_li, li in enumerate(newlist):
if i['id'] == li['id']:
if sort_dict[i['properties']['type']] >= sort_dict[li['properties']['type']]:
newlist[ind_li] = i
else:
flag = False
if flag:
newlist.append(i)
return newlist