目录
一、引言
在做数据预处理时,有时得到的列表数据格式中,可能存在人为误操作或其他原因导致添加重复元素。因此,本文记录几种常用的列表去重python操作代码,并且区分列表内的元素类型
二、列表内元素为数值number去重方法
1.使用set()无序去重
将列表转为集合就可以完成去重了,因为集合数据不允许出现重复元素。
(注意:但是这种方式会打乱原列表顺序,因为集合是无序的,这种方法适合对顺序不关心的数据)
list = [1, 2, 2, 3, 4, 4, 5]
unique_list = list(set(list))
print(unique_list) # 输出:[1, 2, 3, 4, 5]
2.使用dict.fromkes()保持顺序去重
使用 dict.fromkeys(list)的方式,可以在保留原数据列表顺序的基础上去重。
list = [1, 2, 2, 3, 4, 4, 5]
unique_list = list(dict.fromkeys(list))
print(unique_list) # 输出:[1, 2, 3, 4, 5]