python做表的按列计数重复值

excel没有方便的重复值计数显示功能,批量操作很麻烦。所以用pd.value_counts()写了个python批量操作函数。时间复杂度可能有点高,我跑几万条数据跑了十几分钟,要跑大数据还是用别的吧。代码如下:

import pandas as pd


def cfzjs(data):   #重复值计数
    col_data=data.columns.values.tolist()
    df_cfz=pd.DataFrame(columns=col_data)
    for list_i in col_data:
        ret=pd.value_counts(data[list_i])
        list1=[]
        for i,j in ret.items():
            result="{}:{}".format(i,str(j))
            list1.append(result)
        for i in range(len(list1)):
            df_cfz.loc[i,list_i]=list1[i]
    return df_cfz
#输出dataframe


df1=pd.read_excel(".xlsx",sheet_name='')
df2=pd.read_excel(".xlsx",sheet_name='')  #起始行不是第一行的话,输入header=行数-1



list1=[df1,df2]
for i in list1:
    i=cfzjs(i)

with pd.ExcelWriter(".xlsx") as writer:
    df1.to_excel(writer, sheet_name='Sheet1', index=False)
    df2.to_excel(writer, sheet_name='Sheet2', index=False)

结果大概是这样的:

如果想要把重复值与计数分开可以在excel中数据-分列拆分,不过应该不需要

over 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值