4 pandas统计分析基础
4.4 使用分组聚合进行组内计算
4.4.1 使用groupby方法拆分数据
1.groupby方法的参数及其说明
该方法提供的是分组聚合步骤中的拆分功能,能根据索引或字段对数据进行分组。其常用参数与使用格式如下。
DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwargs)
- by参数
如果传入的是一个函数则对索引进行计算并分组。
如果传入的是一个字典或者Series则字典或者Series的值用来做分组依据。
如果传入一个NumPy数组则数据的元素作为分组依据。
如果传入的是字符串或者字符串列表则使用这些字符串所代表的字段作为分组依据。
2.GroupBy对象常用的描述性统计方法
用groupby方法分组后的结果并不能直接查看,而是被存在内存中,输出的是内存地址。实际上分组后的数据对象GroupBy类似Series与DataFrame,是pandas提供的一种对象。GroupBy对象常用的描述性统计方法如下。
4.4.2 使用agg方法聚合数据
1.agg和aggregate函数参数及其说明
agg,aggregate方法都支持对每个分组应用某函数&#x