python中drop用法 去重_Pandas-去除重复项函数drop_duplicates()

Pandas-去除重复项函数drop_duplicates()

一、drop_duplicates函数用途

pandas中的drop_duplicates()函数可以通过SQL中关键字distinct的用法来理解,根据指定的字段对数据集进行去重处理。

二、drop_duplicates()函数的具体参数

*

用法:

DataFrame.drop_duplicates(subset=None, keep=‘first’, inplace=False)

*

参数说明

参数 说明

subset 根据指定的列名进行去重,默认整个数据集

keep 可选{‘first’, ‘last’,

False},默认first,即默认保留第一次出现的重复值,并删去其他重复的数据,False是指删去所有重复数据。

inplace 是否对数据集本身进行修改,默认False

三、drop_duplicates用法举例

* 根据指定字段进行去重,保留第一次出现的数据 import pandas as pd #创建数据框 df=pd.DataFrame({ 'a':[1,2,

4,3,3,3,4], 'b':[2,3,3,4,4,5,3] }) print('去重前:\n',df) #根据字段a进行去重,保留第一次出现的数据 df.

drop_duplicates(['a'],keep='first',inplace=True) print('去重后:\n',df) >>> 去重前: a b

0 1 2 1 2 3 2 4 3 3 3 4 4 3 4 5 3 5 6 4 3 去重后: a b 0 1 2 1 2 3 2 4 3 3 3 4

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值