[Pandas] DataFrame.drop_duplicates() 删除重复值

山茶花开时。

已于 2023-12-12 15:05:19 修改

阅读量5.5k

点赞数 9

分类专栏： Pandas 文章标签： python pandas 数据分析

于 2022-02-14 20:26:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Hudas/article/details/122920865

版权

Pandas 专栏收录该内容

55 篇文章 40 订阅

订阅专栏

语法

df.drop_duplicates(subset = None,
                   keep = 'first', 
                   inplace = False, 
                   ignore_index = False)

参数

1.subset:指定的标签或标签序列，仅删除这些列重复值，默认情况为所有列

2.keep:确定要保留的重复值，有以下可选项:

first:保留第一次出现的重复值，默认

last:保留最后一次出现的重复值

False:删除所有重复值

3.inplace:是否生效

4.ignore_index:如果为True，则重新分配自然索引(0,1,…,n - 1)

# 删除重复值 DataFrame.drop_duplicates()
import pandas as pd

df = pd.DataFrame([['x','x',1],['x','x',1],['z','x',2]], columns = ['A','B','C'])

# 删除重复行
res1 = df.drop_duplicates()

# 删除指定列中包含重复值的行
res2 = df.drop_duplicates(subset = ['A'])

# 保留最后一个
res3 = df.drop_duplicates(subset = ['A'], keep = 'last')

结果展示

df

res1

res2

res3

扩展:识别重复值

import pandas as pd

df = pd.DataFrame({
    'studentID':['A001','A002','A003','A004','A005','A006','A006'],
    'score':[100,93,94,96,93,95,95]})

# 识别重复值
duplicate_value = df[df.duplicated()]

df

由上图可知studentID为'A006'的记录有两条，我们可以使用duplicated()方法识别重复值，它返回的是布尔值结果(True:有重复值，False:无重复值)

duplicate_value

山茶花开时。

关注

9
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

山茶花开时。 CSDN认证博客专家 CSDN认证企业博客

码龄3年

362: 原创

3111: 周排名

4073: 总排名

179万+: 访问

: 等级

6081: 积分

4万+: 粉丝

2087: 获赞

245: 评论

6405: 收藏

私信

关注

热门文章

分类专栏

最新评论

[SAP ABAP] 创建数据库视图和维护视图
山茶花开时。: INNER JOIN内连接：查询的结果为两个表匹配到的数据 LEFT JOIN左连接：查询的结果为两个表匹配到的数据，左表的记录将会全部表示出来，而右表只会显示符合搜索条件的记录，对于右表中不存在的数据使用空白填充
[SAP ABAP] 创建数据库视图和维护视图
山茶花开时。: 使用视图，可以表示表中包含的数据的子集，也可以将多个表连接到单个表中
[SAP ABAP] 创建数据库视图和维护视图
山茶花开时。: 视图不会占用存储空间
[SAP ABAP] 创建数据元素
山茶花开时。: 中英文切换系统，导致数据库表中的数据元素部分信息描述缺失，这里我们可以使用(翻译)
[SAP ABAP] 内表
山茶花开时。: 内表是可以在程序内部定义且使用的表，属于本地表

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。