分组聚合与数据可视化
一、分组聚合
1.1分组聚合操作的定义
分组聚合操作指的是按照某项规则对数据进行分组,接着对分完组的数据执行总结性统计的操作(比如求和、求均值)。根据其分组方式的不同可以分为单层分组聚合操作以及多层分组聚合操作。
1.1、单层分组聚合:df.groupby(by)[‘列索引’].mean()。
单层分组聚合操作指的是针对某一个组进行聚合操作。
In [ 3 ]
1 # 创建DataFrame对象
2 grade_df = pd.DataFrame({
'班级': [1, 1, 1, 1, 1, 2, 2, 2, 2, 2],
3
'性别': ['男', '男', '女', '女', '女', '男', '男', '男', '女', '女'],
4
'眼镜': ['是', '否', '是', '否', '是', '是', '是', '否', '否', '否'],
5
'成绩': [95, 90, 96, 92, 94, 85, 87, 80, 81, 86]})
6 # 查看grade_df
7 grade_df
Out