python excel处理 pandas 统计重复数据

最新推荐文章于 2024-07-04 17:36:31 发布

bismillahhh

最新推荐文章于 2024-07-04 17:36:31 发布

阅读量1.3k

点赞数

分类专栏： python 文章标签： python 开发语言后端

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41617060/article/details/121138683

版权

python 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

读取excel文件，并找到重复的数据

df = pd.read_excel(r'project.xls',sheet_name='Sheet1')
data = {}
dupList = [k for k,v in df['title'].value_counts().to_dict().items() if v > 1]
print(type(dupList),len(dupList),dupList)
for i in dupList:
    d = df[df['title']==i]['id'].tolist()
    data[i] = d
print(data)

处理结果：

{'title1': ['2110251552596668', '2110251913137755', '2110251930146802'], ...}

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

bismillahhh CSDN认证博客专家 CSDN认证企业博客

码龄7年

55: 原创

9万+: 周排名

160万+: 总排名

14万+: 访问

: 等级

1269: 积分

249: 粉丝

84: 获赞

10: 评论

206: 收藏

私信

关注

分类专栏

最新评论

图数据库 py2neo driver 使用笔记
bismillahhh: 如果你是数据复杂度的问题，可以考虑使用插件apoc中的路径查询方法。
图数据库 py2neo driver 使用笔记
weixin_42576965: 老哥在解析路径查询结果的时候速度很慢是怎么回事
sql表数据到图结构转换服务
羊又串真好吃: 博主写的真好，学到了，有些问题想跟您私下交流，能否留个违心呐
python float 精度处理
技术小白白~: 挺好的，python float 精度处理很不错！收获满满，感谢大佬分享，平时相互学习呀，可以给个WX吗？
电脑进入BIOS系统的简单方法。
weixin_48054158: 谢了啊大佬

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。