python Dataframe类型去重

jw0413

已于 2023-08-24 15:10:51 修改

阅读量2.3k

点赞数

分类专栏： python基础编写文章标签： python 开发语言

于 2023-08-14 13:29:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jw0413/article/details/132274043

版权

python基础编写专栏收录该内容

3 篇文章 0 订阅

订阅专栏

去除重复数据——drop_duplicates
去除指定单列或多列中的完全重复的项通过drop_duplicates()函数实现，需要利用Pandas包。

其中：

1、subset=[] 表示整个dataframe基于[]内选定列进行数据重复内容识别，可以添加多列数据进行识别。

（1）添加一列列名时表示对选中的单列数据进行重复数据识别，

（2）添加多列时则表示识别多列数据同时重复的情况；

2、keep='' 表示对选中的重复数据操作策略，可选择的参数为'first'、'last'和'False'三种。

（1）'first'表示在识别的重复项中保留按照索引顺序的第一个内容，其余删除，

（2）'last'表示在识别的重复项中保留按照索引顺序的最后一个内容，其余删除，

（3）'False'表示删除所有重复项；

3、inplace= 表示对处理好的dataframe存储策略，可选择参数为False和True

（1）False表示不对原始数据进行去重工作，例如示例代码中data1内容不改变，将处理结果赋予data参数中，

（2）True表示去重工作直接在原始数据中进行操作，例如示例代码中data1中去重操作会直接在data1中进行，data不会被赋值。

data = data.drop_duplicates(subset=['列名1', '列名2'], keep='first', inplace=False)

————————————————
版权声明：本文为CSDN博主「羊羊麾下的发电站」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/gisaavg/article/details/124516669

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python Dataframe类型去重

（1）False表示不对原始数据进行去重工作，例如示例代码中data1内容不改变，将处理结果赋予data参数中，原文链接：https://blog.csdn.net/gisaavg/article/details/124516669。2、keep='' 表示对选中的重复数据操作策略，可选择的参数为'first'、'last'和'False'三种。（1）'first'表示在识别的重复项中保留按照索引顺序的第一个内容，其余删除，（2）'last'表示在识别的重复项中保留按照索引顺序的最后一个内容，其余删除，
复制链接

扫一扫

专栏目录

jw0413

CSDN认证博客专家 CSDN认证企业博客

码龄4年

3: 原创

21万+: 周排名

80万+: 总排名

3957: 访问

: 等级

31: 积分

1: 粉丝

1: 获赞

1: 评论

6: 收藏

私信

关注

热门文章

分类专栏

python基础编写 3篇

最新评论

python的vlookup功能
CSDN-Ada助手: 恭喜您写了第三篇博客！标题“python的vlookup功能”听起来很有趣。我对于您深入探索Python的功能感到非常欣喜。看到您持续创作的努力，我感到非常激动。在下一步的创作中，也许您可以尝试介绍一些高级的数据分析技巧，或者分享一些实用的数据处理方法。我相信您的谦虚态度和博学能够为读者带来更多的收获。期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。