背景
最近一直在学习新的东西,就在那个阳光明媚的下午,忽然接到一波需求,需要紧急搞定一个需求,没办法经过一段时间的思考终于弄重来了,现在这分享,希望可以帮助到有相同情况的人。
几个输入输出list的例子
In:[[6666,1010],[6666,1012],[6666,1010,1012]]Out:[1010,1012,6666]In:[[1010,3631],[1013,1014,2397,3540,3631],[1013,3631],[1014,2397,3631],[3540,3631]]Out:[1010, 3631, 1013, 1014, 2397, 3540]
输入输出中的一些规律介绍
- 输入一定是list套list的形式[仅包含两层嵌套]。
- 每个输入的list中一个有一个list是所有子list的全集。
- 例如:In:[[6666,1010],[6666,1012],[6666,1010,1012]] 中 [6666,1010,1012]只用的元素包含[6666,1010],[6666,1012]中的所有值
- 全集要保留与所有自己子集共同的值,并要保证取值顺序不变。
思考过程
- 因为列表中数据可能是不是按照顺序排列的,所以首先将子列表先进行升序排列。
- 因为只有全集需要留下那个各个子集共有的值,故先找到全集在列表中的下标。
- 找到全集和子集共有的那个值。
- 循环list判断如果是全集的话就仅保留共有值,如果不是全集的list就将共有值删除。
- 对list套list进行拆分,拆分成一层的list。
- 按顺序去重,为保证输入的值过大而导致内存占满,应用python生成器。
思考过程代码实现
In_lists = [[6666,1010],[6666,1012],[6666,1010,1012]]def dedupe(lists): """ 对列表套列表按需求去重 :param list_s: [[175,188],[176,188],[175,176,188]] :return: [175, 176, 188] """ output_list = [] # 输出列表提前定义 seen = set() # 去重需要 lists = [sorted(lis) for lis in lists] # 对子列表进行排序 len_list = [len(lis) for lis in lists] # 获取每个子列表长度 max_index = len_list.index(max(len_list)) # 最长的列表为全集 elements_in_all = list(set.intersection(*map(set, lists))) # 找到那个公共值 for lis_index in range(len(lists)): if lis_index == max_index: # 如果下标为全集则用公共值覆盖 input_list = elements_in_all else: elements_index = lists[lis_index].index(elements_in_all[0]) del lists[lis_index][elements_index] input_list = lists[lis_index] output_list.extend(input_list) for item in output_list: # 按顺序去重 if item not in seen: yield item seen.add(item)print(list(dedupe(In_lists)))# Out = [1010, 1012, 6666]
#python##软件开发##程序员#