学习Pandas时,对于df.groupby(col1).agg(np.mean)结果有疑问:
以下是示例
输入:
df = pd.DataFrame({'A':np.array(['foo','foo','foo','foo','bar','bar']),
'B':np.array(['one','one','two','two','three','three']),
'C':np.array(['small','medium','large','large','small','small']),
'D':np.array([1,2,2,3,3,5])})
df
输出:
输入: df.groupby('A').agg(np.mean) #返回按列A分组的所有列的均值
输出:
等同于: df.groupby('A')['D'].mean() #只有D列是数值型的数据,将df按照A列分组,然后对D列数据求均值
输出:
bar: 8/2=4,foo:8/4=2 得到最终结果