代码基于jupyter实现
1. 引入依赖文件,并定义一个数据
import pandas as pd
import numpy as np
df = pd.DataFrame({'A': [1, 1, 2, 2],
'B': [1, 2, 3, 4],
'C': np.random.randn(4)})
df
输出:
2. reset_index() 表示重新设置索引
df.groupby(['A','B']).sum().reset_index()
输出:
3. agg传进来的统计特征:按照 A 这一列作聚合,C 这一列作统计
df = df.groupby('B')['C'].agg(['min','max','mean','sum','count','std','median']).reset_index() # reset_index()是为了重置索引项
df
输出: