大家好,今天给大家带来数据分析项目实战第三节内容,书接上回1-2,现在我们有如下需求:请对每月的消费金额,次数,数量,以及人数进行统计分析。
month_amount = df.groupby('month')['or_amount'].sum()
month_num = df.groupby('month')['or_num'].sum()
month_count = df.groupby('month')['id'].count()
month_id = df.groupby('month')['id'].apply(lambda x :len(x.unique()))
plt.figure(figsize=(20,8))
plt.subplot(221) #将画布分成2行2列,取第1个
month_amount.plot()
plt.subplot(222)
month_num.plot()
plt.subplot(223)
month_count.plot()
plt.subplot(224)
month_id.plot()
plt.show()
我们对数据进行按月分组,并提取出对应分析的字段进行求和或者计数。这里分组得到的数据是一个分组类型,他有两部分构成,一个是组别标题在这里就是不同的月份,还有就是其对于的数据,要想查看,需要循环遍历。
month_amount = df.groupby('month')['or_amount'] for x,y in month_amount: print(x) print(y)
结果如下: