pivot_table(数据透视表)可以看做是一种高级的groupby功能,下面贴两段代码比较一下:
df=pd.read_csv('2016_sale.csv')
a=pd.pivot_table(df,index=['Category','Buyer','Product'],values=['Qty','Amount'],aggfunc={'Qty':(np.sum),'Amount':(np.sum)})
b=df[['Buyer','Category','Product','Amount','Qty']].groupby(['Category','Buyer','Product']).sum()
a和b的结果是一样的,不过明显a的表达式比较灵活,尤其是当对于不同字段有不同聚合函数时(比如有些要SUM,有些要MEAN,可以自定义)。