Pandas中的分组与聚合运算
Pandas中分组函数groupby的使用
对于groupby操作可以分为3中情形:(1)Splitting:按照某种规则将数据分为不同的组(2)applying:对于每组数据分别执行一个函数(3) Combining:将结果整合到一个数据结构中。
# 创建数据
df = pd.DataFrame({'A':[1,2,3,4,5,6,7,8,9,10],
'B':['a','a','c','d','c','d','b','b','c','c'],
'C':[12,13,12,102,110,107,106,12,13,13]})
(1) 按照‘B'进行分组并求均值
df.groupby('B').mean()
# 注意'B'组元素是字符
# 按照多个分组来求均值
df.groupby(['A','B']).mean()
分组后选择某一列数据来进行运算
a = df.groupby('B')
a['A'].mean()
a['A','C'].mean()
Pandas中的聚合运算agg
- 执行3种不同的聚合运算,每一行对应不同的运算
- 对每列执行不同的聚合运算
df['B'] = [11,12,13,11,12,13,12,12,23,10]
df.agg({'A':['sum','min'],'B':['max','min'],'C':['sum','min']})