一、groupby函数
(a)根据某一列分组
grouped_single = df.groupby('School')
groupby分组后会生成一个groupby对象,该对象不会返回任何东西,只有当相应方法被调用才会起作用
比如取出一个组
grouped_single.get_group('S_1')
(b)根据某几列分组
grouped_single= df.groupby(['School','Class'])
grouped_single.get_group(('S_2','C_4'))
(c)获取组容量与组数
grouped_single.size() #输出每个组的组名和容量
grouped_single.ngroups #输出组的数量
(d)组的遍历
for name,group in group_single:
print(name)
display(group.head(3))
(e)level参数(多级索引)和axis参数
df.set_index(['Gender','School']).groupby(level=1,axis=0).get_group('S_1')
2.group对象的特点
(a)查看可调用的方法
dir()函数不带参数时,返回当前范围内的变量、方法和定义的类型列表;带参数返回参数的属性、方法列表
print([attr for attr in dir