groupby分组运算的三个阶段:split--apply--combine(拆分-应用-合并)
本篇主要讲split阶段,groupby分组,即我们可以通过哪些方式对DataFrame进行分组
分组键概览:
- DataFrame中的列
- 自定义数组
- 字典或者Series
- 通过函数进行分组
- 根据索引级别分组
一、通过DataFrame中的列进行分组
Note:1. df['列名'].groupby(df['列名'])
---前者表示待划分的数据,后者表示划分数据的依据
2. 可以根据多个键进行划分
3. 可以直接使用列名进行分组依据,但前提是调用groupby的部分DataFrame必须包含该列名
4. 直接对整个DataFrame调用groupby时,所有数值列均会被聚合
二、根据自定义数据进行分组
Note:根据数据进行划分,那么该数组的长度要与被划分的轴长度一致
三、通过字典或Series进行分组
Note:1. 通过字典:对待划分的轴进行映射
2. 通过Series:Series的索引和分组轴的对应
四、通过函数进行分组
Note:函数是作用在分组轴上,返回值被用作分组依据
五、根据不同的索引级别进行分组
Note:通过level参数,通过索引级别进行聚合
补充说明:
- 补充一、groupby说明文档
- 补充二、分组迭代
- 补充二、groupby聚合的另一种形式