1 透视表
1.1 pivot与pivot_table
pivot
函数可将某一列作为新的cols。但pivot函数具有很强的局限性,除了功能上较少之外,还不允许values中出现重复的行列索引对(pair)
df.pivot(index='ID',columns='Gender',values='Height')
df.pivot(index='School',columns='Gender',values='Height')
pivot_table
函数的功能更多,但速度较慢。下面介绍常用参数:
- aggfunc:对组内进行聚合统计,可传入各类函数,默认为’mean’;
- margins:为
True
时汇总边际状态;
- margins_name:边际状态名字,默认为
all
- index行、columns列、values值都可以是多级,此时参数为列表形式;
pd.pivot_table(df,index='ID',columns='Gender',values='Height')
pd.pivot_table(df,index='School',columns='Gender',values='Height',aggfunc=['mean','sum'])
pd.pivot_table(df,index='School',columns='Gender',values