Pandas 数据重复处理 duplicated()和drop_duplicates()

海洋之心

已于 2022-11-27 10:14:05 修改

阅读量1.9k

点赞数 7

分类专栏： AI 机器学习知识积累文章标签： python java 数据分析大数据算法

于 2021-02-11 11:49:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_47256162/article/details/113789388

版权

机器学习知识积累同时被 2 个专栏收录

79 篇文章

订阅专栏

33 篇文章

订阅专栏

本文介绍了如何使用Python的pandas库处理数据重复问题，包括使用duplicated()检查重复项，利用drop_duplicates()删除重复值，并通过实例展示了具体操作。适合初学者了解和实践数据清洗。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

🌠 『精品学习专栏导航帖』

🐳最适合入门的100个深度学习实战项目🐳
🐙【PyTorch深度学习项目实战100例目录】项目详解 + 数据集 + 完整源码🐙
🐶【机器学习入门项目10例目录】项目详解 + 数据集 + 完整源码🐶
🦜【机器学习项目实战10例目录】项目详解 + 数据集 + 完整源码🦜
🐌Java经典编程100例🐌
🦋Python经典编程100例🦋
🦄蓝桥杯历届真题题目+解析+代码+答案🦄
🐯【2023王道数据结构目录】课后算法设计题C、C++代码实现完整版大全🐯

文章目录

✌ duplicated()和drop_duplicates()

✌ duplicated()和drop_duplicates()

✌ 导库

import pandas as pd
import numpy as np

✌ 创建数据集

x=np.array([[1,2,3],[3,4,5],[1,2,3],[1,2,3]])
x=pd.DataFrame(x)
x

在这里插入图片描述

✌ duplicated（）

返回每行数据是否重复

x.duplicated()

在这里插入图片描述

✌ 计算重复数据数目

x.duplicated().sum()

在这里插入图片描述

✌ drop_duplicates()

删除重复值

x=x.drop_duplicates()
x

在这里插入图片描述

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

海洋之心 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。