通过去重进行数据清洗

最新推荐文章于 2024-04-23 00:26:44 发布

徐念安

最新推荐文章于 2024-04-23 00:26:44 发布

阅读量1.2k

点赞数

分类专栏：数据科学文章标签：数据科学数据去重数据清洗 Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/geekmubai/article/details/86667459

版权

数据科学专栏收录该内容

25 篇文章 7 订阅

订阅专栏

通过去重进行数据清洗

数据初始

Seqno列去重

查看Seqno列都有哪些值

df['Seqno'].unique()  # 查看唯一的值

duplicated方法
duplicated用于从上到下比较指定某一列的值，当这个值第一次出现时，返回False，当这个值和上一个比一样时，返回True

df['Seqno'].duplicated()

drop_duplicates去重复

drop_duplicates方法将会把这一列duplicated方法结果中为True的项删除，False的项保留。在不指定keep的时候，它的值默认为first，表示如果有多个重复的则保留第一个。也可以指定其他的值，比如last。

注意:

df1['Seqno'].drop_duplicates()   # 返回一个新的关于Seqno的Serirs
df1.drop_duplicates()            # 按照一行四个元素的一致性去重的
df.drop_duplicates(['Seqno'])    # 指定按照Seqno这一列的值为基准进行去重

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
通过去重进行数据清洗

通过去重进行数据清洗数据初始Seqno列去重查看Seqno列都有哪些值df['Seqno'].unique() # 查看唯一的值duplicated方法duplicated用于从上到下比较指定某一列的值，当这个值第一次出现时，返回False，当这个值和上一个比一样时，返回Truedf['Seqno'].duplicated()drop_duplicates去重复dr...
复制链接

扫一扫

专栏目录

徐念安 CSDN认证博客专家 CSDN认证企业博客

码龄6年

110: 原创

9万+: 周排名

164万+: 总排名

63万+: 访问

: 等级

5199: 积分

291: 粉丝

576: 获赞

88: 评论

2164: 收藏

私信

关注

热门文章

分类专栏

最新评论

Apply函数进行数据预处理
Z2051604807: 大佬，这个csv文件方便分享一下吗
Java方法重写与重载的区别
风起风落时: 巩固一下
Seaborn
阿卡林！！: 您好，相关数据的xlsx能否发一下呢？
Java方法重写与重载的区别
林阿云: 建议你仔细看看，前一句说限制权限下一句就private限制最小？新手搁这学知识呢还是给你抠字眼呢，本来就不懂还搞文字游戏，搁这学语文呢，第三点的例子也是，private不能重写和子类访问权限不能比父类严格有很大关系吗，这点就不是在这位置说的，文章漏洞多还怕人说，你真网络好人呗。
数据采集：如何自动化采集数据？
IOTOS: 数据采集软件有很多，不过现在的智慧项目会涉及到很多不同品牌型号的型号，后期更是需要扩展的功能，要统一采集的平台很少，而爱投斯（IOTOS）物联网中间件平台可以满足这些需求，除此之外还可以用于数据展示和应用开发，能够更快更低成本的帮助用户开发行业系统。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。