python做表的按列计数重复值

最新推荐文章于 2024-03-15 11:18:27 发布

nanjc

最新推荐文章于 2024-03-15 11:18:27 发布

阅读量575

点赞数

文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_49617724/article/details/130204519

版权

excel没有方便的重复值计数显示功能，批量操作很麻烦。所以用pd.value_counts()写了个python批量操作函数。时间复杂度可能有点高，我跑几万条数据跑了十几分钟，要跑大数据还是用别的吧。代码如下：

import pandas as pd


def cfzjs(data):   #重复值计数
    col_data=data.columns.values.tolist()
    df_cfz=pd.DataFrame(columns=col_data)
    for list_i in col_data:
        ret=pd.value_counts(data[list_i])
        list1=[]
        for i,j in ret.items():
            result="{}:{}".format(i,str(j))
            list1.append(result)
        for i in range(len(list1)):
            df_cfz.loc[i,list_i]=list1[i]
    return df_cfz
#输出dataframe


df1=pd.read_excel(".xlsx",sheet_name='')
df2=pd.read_excel(".xlsx",sheet_name='')  #起始行不是第一行的话，输入header=行数-1



list1=[df1,df2]
for i in list1:
    i=cfzjs(i)

with pd.ExcelWriter(".xlsx") as writer:
    df1.to_excel(writer, sheet_name='Sheet1', index=False)
    df2.to_excel(writer, sheet_name='Sheet2', index=False)

结果大概是这样的：

如果想要把重复值与计数分开可以在excel中数据-分列拆分，不过应该不需要

over

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

nanjc

CSDN认证博客专家 CSDN认证企业博客

码龄4年

5: 原创

79万+: 周排名

60万+: 总排名

3699: 访问

: 等级

57: 积分

3: 粉丝

6: 获赞

3: 评论

32: 收藏

私信

关注

热门文章

最新评论

matlab遗传算法解tsp旅行商问题实战
m0_72134945: 我为啥只会有第一张图啊我是小白真的不明白
python做表的按列计数重复值
CSDN-Ada助手: 恭喜您写出了这篇有关Python计数重复值的博客！非常感谢您在这个领域的分享。接下来，我建议您可以深入研究Python相关的数据处理方法，例如数据清洗和可视化。这将有助于您更好地掌握Python数据处理的技能。期待您的更多精彩博客！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
dataframe 替换满足条件的某一列非Nan值（python数据清洗）
CSDN-Ada助手: 恭喜您又发布了一篇内容丰富、实用的博客！您的python数据清洗系列博客让我受益匪浅。在这篇博客中，您介绍了如何使用dataframe替换某一列非Nan值，对于我这样的初学者来说十分实用。接下来，我建议您可以探讨一下如何在数据清洗过程中避免出现意外错误，例如数据类型转换错误等。期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。