1.group by函数
- 根据一列分组:如group1 = df.groupby(‘School’)
- 根据多列分组:如group2 = df.groupby([‘School’,‘Class’])
- 查看组容量与组数:
group1.size()
group1.ngroups - 组的遍历:for name,group in group1:
- 根据奇偶行分组:
df.groupby(lambda x:‘奇数行’ if not df.index.get_loc(x)%2==1 else ‘偶数行’).groups - 连续型变量分组:
2.聚合函数(aggregation)
mean/sum/size/count/std/var/sem/describe/first/last/nth/min/max都是聚合函数
3.过滤(Filteration)
filter()是用来筛选某些组的(结果是组的全体),因此传入的值应当是布尔标量
4. 变换(Transformation)
transform函数中传入的对象是组内的列,并且返回值需要与列长完全一致