pandas学习记录:concat列拼接出现错位(去除重复项之后)

使用pandas在处理csv或者xsl数据时,往往数据中会出现重复项,这时就需要去除重复项,在进行其他操作。
我的应用场景是去除所有列都重复的数据行

data.drop_duplicates(inplace=True)

使用drop_duplicates函数进行重复项的删除,inplace参数代表是在原来的数据上进行操作还是建立一个新的副本,还可以传入依照去重的列名(即依照一列或几列进行去重)

这篇笔记所想要记录的重点是,我在进行重复数据删除后,进行了列的concat 明明是相同长度的列concat时却出现了错位现象。
至此,我才发现,drop_duplicates删除重复项的同时,index还是原来的index,即原来是1,2,3,4当删除第三行时变为1,2,4 不会自动重新排序。因此在concat时,列的拼接由于是根据index来的,就会出现错位现象

data = data.reset_index(drop=True)

使用reset_index函数来进行重新index

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值