分组
group = df.groupby('院系') //按照某个特征进行分组
group.count() #统计每个分类下的数值个数
group.sum() #计算每个分类的数值总和,会自动忽略非数字的列
df.groupby(['院系','考场']).count() //按照两个特征进行分组
df.groupby('院系').aggregate(['count','sum']) //对分组的列进行统计计算
df.groupby('院系').aggregate({'姓名':'count','政治':'sum','english':'mean'}) //用字典的方式传入参数,可以对不同的列进行不同的统计计算
数据透视表
pd.pivot_table(df,index='院系',columns='考场',values='姓名',aggfunc='count',margins=True,margins_name='合计')
// 参数含义 df 是原始数据表
index= 是需要的行的名字
columns = 是需要的列的名字
values = 是需要在表格中填写的数值
aggfunc = 是对数值的统计方式
margins = 是否求合计
margins_name = 合计列的名字
pd.pivot_table(df,index='院系',columns='考场',values=['姓名','数学'],aggfunc={'姓名':'count','数学':'mean'})
// aggfunc可以用字典的方式传入数据,让结果对不同的列进行不同的统计计算