- 函数apply即可用于分组对象,也可以作用于dataframe数据
- Groupby.apply(func)
- 需要注意axis=0和axis=1的区别
loan_info.apply(np.sum,axis=0)#相当于计算每列的均值
loan_info['sum']=loan_info.apply(np.sum,axis=1)#相当于计算每行的总和
loan_info[['dkje','ye']].apply(lambda x:x[0]-x[1],axis=1)#计算两个变量的差值
#分组
grouped=df.groupby('weekday')
#对分组数据求均值,只能对一个方法计算,grouped.apply([np.mean,np.max])会报错
#apply不同于聚合函数,只能对一个统计方法进行计算
grouped.apply(np.mean)
#对分组数据中的特定字段求均值
grouped.apply(np.mean)[['total_items','discoun%','weekday']]
df.columns#输出统计字段
var=['Food%','Fresh%','Drink%','Home%','Beauty%','Health%','Baby%']
df[var].apply(np.sum,axis=0)#计算每一个字段变量的总和,
df[var].apply(np.sum,axis=1)#计算每一行变量的总和,
#
df[var].apply(lambda x:x[0]-x[1],axis=1)