要求:先分组计算均值,再计算结果中的最大值和最大值所在行的index值,主要用到groupby函数。这里记录学习笔记。
df = pd.read_excel('path of file')
df_mean = df.groupby(['b','a'])['c'].mean().reset_index()#根据a,b分组,对c列进行求平均运算
注意:.reset_index() 可以将数据平铺。
再计算最大值:df_mean_max = df_mean.groupby('a')['c'].max().reset_index()
提取最大值所在的行:
(1)先将某一列设置为index:df_median.set_index(["f"], inplace=True)
(2)提取最大值,并返回index:idm = df_median.groupby('a')['c'].idxmax()