在将数据集准备好了之后,通常的任务是计算分组统计或生成透视表。
pandas提供了groupby功能,可以自然地对数据集进行切片、切块和摘要。
在本章中,我们将会学到:
1根据一个或多个键(函数、数组或DataFrame列名)拆分pandas对象
2.计算分组摘要统计,如计数、平均值,标准差
3.对DataFrame的列应用各种各样的函数
4.计算透视表或交叉表
5.执行分位数分析以及其他分组分析
groupby技术——“split-apply-combine”(拆分-应用-合并)
分组键可以使用:
1.列表或数组
2.表示DataFrame某个列名的值
3.字典或Series,会与待分组轴的值进行一一对应
4.函数,用于处理轴索引或索引中的各个标签
如果按key1分组,可以:
如果一次传入多个分组的数组,那么会根据分组数最多的结果显示,并与其他分组相对应:
可以使用unstack方法,将多重索引展开: