python中excel数据分组处理

1.场景描述

文本相似性热度统计(python版)需求中要根据故障类型进行分组统计,需要对excel进行分组后再分词统计,简单记录下,有需要的朋友可以直接拿走,不客气!

2.解决方案

采用pandas包首先进行分组,然后获取具体明细再进行分词处理(分词处理这里就不展开了),只介绍下python下excel分组,然后对具体明细进行处理。

2.1 完整代码
import pandas as pd

if __name__ == '__main__':
    inputfile = '软件老王-source.xlsx'
    data = pd.read_excel(inputfile)
    grp1 = data.groupby('待分类列')
    rcount = 1
    for name, group in grp1:
        print(group)
        name = name.replace('\n', '').replace('/', '')
        for i in range(len(group)):
            row = group.iloc[i].values  # 返回一个list
            cell = row[1]
            if cell is None:
                continue
            if not isinstance(cell, str):
                continue
            item = cell.strip('\n\r').split('\t')
            string = item[0]
            if string is None or len(string) == 0:
                continue
            else:
                print('这里获取group后明细值,软件老王可以单独处理,类别:' +name + '具体值:' + string)

如果你觉得文章对你有些帮助,欢迎微信搜索「软件老王」第一时间阅读或交流!
2.2 执行效果
 待分类列      原因
0  软件老王1  主机不能加电
1  软件老王1  有时不能加电
2  软件老王1    开机加电
这里获取group后明细值,软件老王可以单独处理,类别:软件老王1具体值:主机不能加电
这里获取group后明细值,软件老王可以单独处理,类别:软件老王1具体值:有时不能加电
这里获取group后明细值,软件老王可以单独处理,类别:软件老王1具体值:开机加电
    待分类列       原因
3  软件老王2  自检报错或死机
4  软件老王2    机器噪音大
这里获取group后明细值,软件老王可以单独处理,类别:软件老王2具体值:自检报错或死机
这里获取group后明细值,软件老王可以单独处理,类别:软件老王2具体值:机器噪音大
    待分类列    原因
5  软件老王3  噪音问题
这里获取group后明细值,软件老王可以单独处理,类别:软件老王3具体值:噪音问题
2.3 软件老王-source.xlsx
待分类列原因
软件老王1主机不能加电
软件老王1有时不能加电
软件老王1开机加电
软件老王2自检报错或死机
软件老王2机器噪音大
软件老王3噪音问题

更多知识请关注公众号:「软件老王」,IT技术与相关干货分享,回复关键字获取对应干货,java,送必看的10本“武功秘籍”;图片,送100多万张可商用高清图片;面试,送刚毕业就能月薪“20k”的java面试题,后续不断更新中,比如“软考”、“工具”等,已经在整理中。

在这里插入图片描述

  • 4
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

软件老王

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值