python数据分析基础
6.数据分组与聚合,原理图详见P126页
1.数据分组
-
groupby()
- 没有分组的键,可以手动新建一个
df = DataFrame(np.arange(16).reshape(4,4))
df
list1 = ['a','b','a','b'] # 新增键
# 按照新增键进行分组
df.groupby(list1).sum()
2.聚合运算
聚合运算就是对 分组后的数据 进行计算
- 聚合运算的方法
- 1.count
- 计数
- 2.sum
- 求和
- 3.mean
- 求均值
- 4.median
- 求数学中位数
- 5.std、var
- 无偏标准差和方差
- 6.min、max
- 求最小值和最大值
- 7.prod
- 求积
- 8.first、last
- 第一个和最后一个值
- 自定义聚合函数
- 通过aggregate或agg参数传入即可
3.分组运算
- transform()
- apply()