s
一.概念‘
分组:使用特定条件将元数据划分多个组
聚合:对每个分组中的数据执行某些操作,最后将计算结果进行整合
二.数据分组
拆分(split) 应用(apply) 合并(combine)
1.可以通过groupby方法
import pandas as pd
import numpy as np
from pandas import Series,DataFrame
data = pd.DataFrame({'key1':['one','two','two','one'],
'key2':['first','second','first','second'],
'data1':[1,2,3,4],'data2':[5,6,7,8]})
输出以后即可返回 groupby对象
grouped = df['data1'].groupby(df['key1'])
grouped.mean()
2.通过字典分组
data = pd.DataFrame({'a':range(0,5),'b':range(5,10),
'c':range(10,15),'d':range(15,20)})
for i in data.groupby({'a':1,'b':2,'c':2,'d':1},axis=1):