有时候aggregate不能满足需求,因为我们要对分组数据进行多种计算,比如要同时计算各组数据的平均数、标准差、总数等等,这时候用agg()就比较好了。
先引入必要的变量,并且创建一个DataFrame
我们可以看一下DataFrame包含哪些数据
按照颜色将数据分组:
计算各组数据的总数、平均数、标准差
计算结果为:
假如我们只需要对a列数据进行计算,可以选择a列:
计算结果为:
假如我们需要定制显示的标题,也可以如此设置:
输出结果为:
另外,我们还可以通过lambda匿名函数来进行特殊的计算:
计算各组数据的绝对值的平均数(离均差):
我们还可以使用字符串作为一个function,要正确使用字符串,必须先学习groupby对象有哪些可用的方法。这种方式可以实现一些更高级的功能,比如定制计算方法,不建议新手使用。
计算结果为: