基本用法
-
相当于 groupby 函数的聚合作用
# 列索引默认除作index的剩余的数值列 pd.pivot_table(df, index) # index = 列名 or [列名1,列名2,...]:设置新的一层or多层索引
-
设置列索引(optional)
pd.pivot_table(df, index, values) # values = 列名 or [列名1,列名2,...]:设置列索引
-
设置多层列索引(optional)
pd.pivot_table(df, index, values, columns) # columns = 列名:此时列名是该列的不同值,i.e.在values每列下分几类
-
设置聚合函数(optional)
pd.pivot_table(df, index, values, columns, aggfunc) # aggfunc = 'mean(默认)/sum'/np.mean/np.sum/.../lambda函数/自定义函数/函数列表
高级用法
- fill_value = int:将所有的缺失值填充为 int
- aggfunc = {‘values下列名1’:函数1,‘values下列名2’:函数2,…}:不同values列下的columns各列的聚合函数