【Python Tips】列表去重——列表list数据预处理:嵌套列表去重

目录

一、引言

二、列表内元素为数值number去重方法

        1.使用set()无序去重

        2.使用dict.fromkes()保持顺序去重

        3.使用pandas的unique去重

        4.使用itertools的groupby去重

三、列表内元素为列表List去重方法

        1.转为元组后set()去重

        2.使用元组的dict.fromkeys()去重

        3.使用pandas的drop_duplicates去


一、引言

        在做数据预处理时,有时得到的列表数据格式中,可能存在人为误操作或其他原因导致添加重复元素。因此,本文记录几种常用的列表去重python操作代码,并且区分列表内的元素类型

二、列表内元素为数值number去重方法

        1.使用set()无序去重

        将列表转为集合就可以完成去重了,因为集合数据不允许出现重复元素。

        (注意:但是这种方式会打乱原列表顺序,因为集合是无序的,这种方法适合对顺序不关心的数据)

list = [1, 2, 2, 3, 4, 4, 5]
unique_list = list(set(list))
print(unique_list)  # 输出:[1, 2, 3, 4, 5]

        2.使用dict.fromkes()保持顺序去重

        使用 dict.fromkeys(list)的方式,可以在保留原数据列表顺序的基础上去重。

list = [1, 2, 2, 3, 4, 4, 5]
unique_list = list(dict.fromkeys(list))
print(unique_list)  # 输出:[1, 2, 3, 4, 5]

       

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值