pandas分组与聚合
Pandas语法:
df [Condition1].groupby([Column1, Column2], as_index=False).agg({Column3: "mean", Column4:"sum"}).filter(Condition2)
1、groupby分组
我们可以通过groupby方法来对Series或DataFrame对象实现分组操作。该方法会返回一个分组对象。不过,如果直接查看(输出)该对象,并不能看到任何的分组信息。
- groups(属性):返回一个字典类型对象,包含分组信息。
- size:返回每组记录的数量。
- discribe:分组查看统计信息。
GroupBy可以分解为三个步骤:split - apply - combine
- Splitting: 把数据按主键划分为很多个小组
- Applying: 对每个小组独立地使用函数
- Combining: 把所得到的结果组合
那么,完成逻辑
- Splitting 由 groupby 实现
- Applying 由 agg、apply、transform、filter实现具体的操作
- Combining 由 concat 等实现
其中,在ap