Pandas透视表的应用,不同列相加,相同列保留的问题

很多时候我们处理Excel表格的时候 会碰到以下情况
红色为相同点 蓝色为不同点
如上图所示 有很多列是一样的 还有不一样的 我们有时候处理数据会要求保留相同的 对不同的进行相加 相当于去重
这个时候pandas的drop_duplicates会显得比较笨重一点
最好的方法是使用类似于Excel中的透视表

在这里我们可以看到此数据a,b,c,d,e都是相同的 其它的都是不同的 按照G列进行区分 因为G列较有说明意义 这里因为是专业分布 所以我是以G列为主 其它视情况而定哦

import pandas as pd
data = pd.read_excel('xxx.xlsx')
data.head()

读取数据

data = pd.pivot_table(data, index=['a','b','c','d','e','g'], values=['f','h','i','j','k','l'],aggfunc='sum')

处理完后
这样就达到我们想要的结果了index是我们含有相同数据或文字的列名,values是我们所要处理的值的列,aggfunc()是我们要怎样处理 也可以是减/计数(count)/平均值(mean)等等 有关参数可参考pandas private_table函数

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Vergil_Zsh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值