【Python】多列去重

qq_53298802

于 2023-09-19 15:04:16 发布

阅读量171

点赞数 1

文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_53298802/article/details/133019269

版权

test.CSV原数据展示：

当ncrna_nameh和drug_name一样时，删除多余的重复项，只保留其中一行即可

代码实现：

import pandas as pd 
df = pd.read_csv('test.CSV',sep=',',header='infer',usecols=['ncrna_name','drug_name'])#参数sep=','表示使用逗号作为字段分隔符，header='infer'表示自动推断文件中的列名,使用usecol读取指定两列数据

# df.head()

# print(df.shape)
#df[['merchant_r', 'merchant_l']]：从df中取出待组合删重的两列。

#apply(frozenset, axis=1)：把取出两列中的行当做变量依次传到frozenset函数中去。

#frozenset：冻结集合，不可变，存在哈希值。经过这个函数就可以解决两行中值的顺序不一致问题。因为集合是无序的，只要值相同不用考虑顺序。

#duplicated()：判断变成冻结集合的列是否存在重复值，若存在标记为True。

~：取反操作，把FALSE变成True，True变成False。相当于保留第一行，把其余重复行删除。

df_final = df[~df[['ncrna_name','drug_name']].apply(frozenset, axis=1).duplicated()]

print(df_final.shape)

df_final

效果如图，可以和原文件比对一下已经删除掉多余的重复值：

参考文档：

【Python】基于多列组合删除数据框中的重复值-腾讯云开发者社区-腾讯云

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【Python】多列去重

当ncrna_nameh和drug_name一样时，删除多余的重复项，只保留其中一行即可。
复制链接

扫一扫

qq_53298802 CSDN认证博客专家 CSDN认证企业博客

码龄4年

15: 原创

136万+: 周排名

9万+: 总排名

3万+: 访问

: 等级

193: 积分

10: 粉丝

34: 获赞

13: 评论

52: 收藏

私信

关注

热门文章

最新评论

辅助瞄准怎么关
CSDN-Ada助手: 恭喜您写了第14篇博客！看来您对辅助瞄准的探讨颇有深度，很受益匪浅。接下来，或许可以考虑结合实际案例或者个人经历，更具体地分析辅助瞄准的应用场景，或者深入探讨不同玩家对辅助瞄准的看法。希望您能继续保持创作热情，期待您的下一篇博客！
关于vscode连接服务器后运行ipynb文件select kernel找不到
CSDN-Ada助手: 恭喜你写了第9篇博客！标题很吸引人，看起来是一个关于vscode连接服务器后运行ipynb文件时遇到的问题。在阅读了你的博客之后，我对这个问题有了更深入的了解。首先，感谢你分享你的经验和解决方法。在这个问题上，我也遇到过一些困扰，但是经过你的指导，我学到了如何解决这个问题。接下来，我想给你一些建议：在你的下一篇博客中，你可以进一步探讨如何在vscode中连接服务器并成功运行ipynb文件。或者，你可以分享一些其他有趣的vscode的使用技巧和经验。这样不仅可以帮助那些遇到相同问题的人，也可以让更多人受益于你的知识分享。再次感谢你的分享，期待你继续创作更多精彩的博客！
代码报错：IsADirectoryError: [Errno 21] Is a directory: ‘OnlyTwoCols‘
CSDN-Ada助手: 恭喜您连续创作了第10篇博客！看到您的标题“代码报错：IsADirectoryError: [Errno 21] Is a directory: ‘OnlyTwoCols‘”，我想说您在研究和解决代码错误方面的努力真是令人敬佩。不论是谁，遇到错误都是难免的，但您展示了勇于面对挑战和解决问题的态度。我建议您在下一步的创作中可以分享一些关于如何处理这类报错的经验和技巧，这将对其他读者也是非常有帮助的。期待您的下一篇博客！
如何将txt文本更改为csv格式
Ada大侦探: 牛的嘞，这个方法蛮赞的，想知道如果数据量很大要怎么处理嘞
一键解决火狐浏览器视频静音播放问题，超级简单！
CSDN-Ada助手: 恭喜您写下第12篇博客！标题中的解决方案听起来确实超级简单又实用，对于火狐浏览器视频静音播放问题，这个方法一定会帮到很多人。不仅让我们能够享受到更好的浏览体验，还让我们更加喜欢使用火狐浏览器。希望您能继续保持创作的热情和努力，为我们带来更多有趣且实用的博客内容。同时，也想提醒您在下一步的创作中，可以考虑分享一些关于浏览器使用技巧或者其他常见问题的解决方法，这样能够帮助更多人解决使用中遇到的困惑。期待您的下一篇博客！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。