关于Python重复元素的判定，简单列举五种方法

农业码农

已于 2023-12-25 16:15:01 修改

阅读量6.2k

点赞数 8

文章标签： python 学习开发语言

于 2023-12-25 16:01:38 首次发布

本文链接：https://blog.csdn.net/m0_61057457/article/details/135201877

版权

我们假设检查的是一个列表是否有重复元素。

以下是其中的五种方法：

1、使用集合（set）

将列表转换为集合会自动去除重复的元素。如果转换后的集合长度与原始列表长度不同，那么原始列表中肯定有重复的元素。

def has_duplicates(lst):
    return len(lst) != len(set(lst))
lst = [1, 2, 3, 4, 5, 3]
print(has_duplicates(lst))  
# 输出：True

2、使用字典

将列表中的元素作为字典的键，如果某个键在字典中已经存在，说明列表中有重复的元素。

def has_duplicates(lst):
    return len(lst) != len(dict.fromkeys(lst))
lst = [1, 2, 3, 4, 5, 3]
print(has_duplicates(lst))  
# 输出：True

3、使用列表推导式

通过在列表推导式中使用if x in判断每个元素是否已经在之前的元素中出现过，如果有则添加到结果列表中。最后检查结果列表的长度是否大于0，如果大于0则表示有重复元素。

def has_duplicates(lst):
    return len([x for i, x in enumerate(lst) if x in lst[:i]]) > 0
lst = [1, 2, 3, 4, 5, 3]
print(has_duplicates(lst))  
# 输出：True

4、使用循环和计数器

使用一个计数器来记录每个元素出现的次数，如果某个元素出现的次数大于1，则说明列表中有重复元素。

def has_duplicates(lst):
    counter = {}
    for x in lst:
        if x in counter:
            return True
        counter[x] = 1
    return False
lst = [1, 2, 3, 4, 5, 3]
print(has_duplicates(lst))  
# 输出：True

5、使用collections.Counter

from collections import Counter
def has_duplicates(lst):
    return any(value > 1 for value in Counter(lst).values())
lst = [1, 2, 3, 4, 5, 3]
print(has_duplicates(lst)) 
# 输出：True

通过Counter()返回一个字典，其中键是元素，值是该元素在列表中出现的次数，接着判断次数是否有大于1的，如果大于1，表示有重复元素。
以上方法各有优缺点，其中使用集合的方法在处理大量数据时效率较高，但会改变原始数据的顺序；使用字典的方法虽然不会改变原始数据的顺序，但在处理大量数据时效率较低；使用列表推导式和循环的方法相对简单易懂，但可能不是最优化的解决方案；使用collections.Counter代码逻辑是正确的，并且效率也高。

我还是比较常用第一种方法，欢迎高手补充更多高效率方法。