groupby后我最头痛的是索引位置感觉不太对,不符合自己想要的,所以经常想将其变成dataframe格式,因为这样我们就可以用很多方法去运算处理了,这时最简单的方法是修改其参数as_index=False,详细情况可以看下面这篇文章
groupby后将其转换为Dataframe格式的两种方法
而这里想说的是groupby后的agg函数,直接上代码
agg函数具体用法可以看这篇文章
# 先看看数据长什么样子
data_merge
rfm_gb = data_merge.groupby(['year','会员ID'],as_index=False).agg({'date_interval':'min', # 计算最近一次订单时间
'提交日期':'count', # 计算订单的频率
'订单金额':'sum'}) # 计算订单的总金额
这里agg()函数是对groupby后的数据进行聚合计算,而且是批量,这里批量是几个一起来的意思
这里引用场景是RFM模型,具体的RFM模型实战可以看看下面这篇文章先
python实践项目 航空公司客户价值分析
你学得的东西越多,越发现自己的渺小 ----翀