数据去重的各种方法汇总(一)

本文汇总了Python中各种数据去重的方法,包括使用set、itertools.groupby、循环筛选、字典fromkeys以及lambda和reduce函数。这些方法在处理列表去重时,有的会改变原始顺序,有的则能保持顺序不变。
摘要由CSDN通过智能技术生成

这几天多次遇到数据去重的问题,所以打算整理一下几种不同类型的数据去重的方法(这里主要汇总Python列表、字典、Excel、数据库的MySQL以及Pandas的Dataframe),暂不更新Leetcode数据库的题解。

  • Python列表、字典去重
  1. 看下面这个例子和第一种解法set()
a = [5, 6, 2, 2, 1, 2, 3,  3, 6, 9, 9]

print(list(set(a)))
#下面是运行后的结果
>>>>>[1, 2, 3, 5, 6, 9]

使用set方法应该是列表去重最简单高效的方法,它利用了集合中的元素不能重复的特性,即唯一性 这个特点来对列表去重,但是打乱了原始列表的顺序

  1. 第二种解法,使用Python内置模块itertools的groupby方法,也不会保留原列表的顺序:
import itertools

a = [5, 6, 2, 2, 1, 2, 3,  3, 6, 9, 9]
a.sort()
b = itertools.groupby(a)
p
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值