pandas学习记录：concat列拼接出现错位（去除重复项之后）

最新推荐文章于 2023-10-27 13:15:22 发布

二楼后座Scarlett

最新推荐文章于 2023-10-27 13:15:22 发布

阅读量7.3k

点赞数 2

分类专栏：学习笔记文章标签： pandas 数据处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014448054/article/details/99851456

版权

学习笔记专栏收录该内容

11 篇文章 0 订阅

订阅专栏

使用pandas在处理csv或者xsl数据时，往往数据中会出现重复项，这时就需要去除重复项，在进行其他操作。
我的应用场景是去除所有列都重复的数据行

data.drop_duplicates(inplace=True)

使用drop_duplicates函数进行重复项的删除，inplace参数代表是在原来的数据上进行操作还是建立一个新的副本，还可以传入依照去重的列名（即依照一列或几列进行去重）

这篇笔记所想要记录的重点是，我在进行重复数据删除后，进行了列的concat 明明是相同长度的列concat时却出现了错位现象。
至此，我才发现，drop_duplicates删除重复项的同时，index还是原来的index，即原来是1，2，3，4当删除第三行时变为1，2，4 不会自动重新排序。因此在concat时，列的拼接由于是根据index来的，就会出现错位现象

data = data.reset_index(drop=True)

使用reset_index函数来进行重新index

二楼后座Scarlett

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
pandas学习记录：concat列拼接出现错位（去除重复项之后）

使用pandas在处理csv或者xsl数据时，往往数据中会出现重复项，这时就需要去除重复项，在进行其他操作。我的应用场景是去除所有列都重复的数据行data.drop_duplicates(inplace=True)使用drop_duplicates函数进行重复项的删除，inplace参数代表是在原来的数据上进行操作还是建立一个新的副本，还可以传入依照去重的列名（即依照一列或几列进行去重）...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。