Pandas 分组
- 初始代码:
import numpy as np
import pandas as pd
df = pd.read_csv('data/table.csv',index_col='ID')
df.head()
SAC
SAC指的是分组操作中的split-apply-combine过程
其中split指基于某一些规则,将数据拆成若干组,apply是指对每一组独立地使用函数,combine指将每一组的结果组合成某一类数据结构
groupby
df.groupby(para)表示按几个列进行分会返回一个groupby对象,group对象调用相应方法会有相应显示
grouped_single = df.groupby('School')
# 取出school中为s_1的行
grouped_single.get_group('S_1').head()
grouped_mul = df.groupby(['School','Class'])
grouped_mul.get_group(('S_2','C_4'