Pandas中分组计数且不计重复的实现

Pandas中分组计数且不计重复的实现


在对dataframe进行分析的时候会遇到需要分组计数,计数的column中属性有重复,但又需要仅对不重复的项计数(即重复N次出现的项只计1次)。函数如下:

dataframe.groupby([‘分组的列名’]).需要计数的列名.nunique()

举例:数组“data”如下:

StoreIDSalesSalesDateChannel
A1002018/1/101
A902018/1/102
A1102018/1/201
B82.22018/1/101
B902018/1/202

如果要按StoreID来统计每一家店的营业日期数(可以通过不计重复的count “SalesDate”来完成)

代码如下:
data.groupby(['StoreID']).SalesDate.nunique()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值