python pandas DataFrame分组
"""
DataFrame 数据分组
即 将数据按照 某列名 分成多个 数据
"""
import pandas as pd
import numpy as np
# 准备数据
ipl_data = {'Team': ['Riders', 'Riders', 'Devils', 'Devils', 'Kings',
'kings', 'Kings', 'Kings', 'Riders', 'Royals', 'Royals', 'Riders'],
'Rank': [1, 2, 2, 3, 3, 4, 1, 1, 2, 4, 1, 2],
'Year': [2014, 2015, 2014, 2015, 2014, 2015, 2016, 2017, 2016, 2014, 2015, 2017],
'Points': [876, 789, 863, 673, 741, 812, 756, 788, 694, 701, 804, 690]}
df = pd.DataFrame(ipl_data)
print(df)
# 分组 按照年份分组
grouped = df.groupby("Year")
print(grouped)
print(grouped.groups)
# 循环遍历分组结果
print("--"*30, "循环遍历分组")
for year, group in grouped:
print(year)
print(group)
# 使用函数调取结果
g2014 = grouped.get_group(2014)
print("-----函数调用分组结果 2014\n", g2014)
# 分组后数据 聚合(分析结果)
print("-----分组 聚合(均值)\n", grouped["Points"].agg(np.mean))
df = grouped["Points"].agg([np.mean, np.max, np.min, np.std])
print("-----分组 聚合(均值, 最大值,最小值)\n", df)
# 显示分组聚合 值
print("-----分组 聚合值\n", df.values)