假如有一个班级学生成绩的数据表,想找知道60分以下、60-70、70-80、80-90、90-100分这几个分数档都有多少学生、占比、以及累计占比的话,可以按照下面的方法来计算:
- 先分类统计,然后计算百分比和累计百分比
import pandas as pd
df = df_学生成绩表.groupby(['成绩分段']).agg({'学生学号':'count'}).reset_index()
# 计算每个类别的占比
df['人数占比'] = df['学生学号'] / df['学生学号'].sum()
# 计算累计占比
df['累计人数占比'] = df['人数占比'].cumsum()
df