目标:
- 学会利⽤pandas对数据进⾏分组
- 知道如何提取分组后的数据
- 可以按多列进⾏分组
- 能够对分组后数据进⾏统计计算
测试数据集:
链接:https://pan.baidu.com/s/1QvY-Qvtl_8QtsMi8sxUD-w
提取码:di2z
一、数据的分组
在pandas当中我们可以利⽤groupby()方法对数据进行分组,返回的是一个分组后的对象, groupby()里面的参数是指定分组的列,分组也分为两种方式 :
①对所有数据进⾏分组
② 对指定列进⾏分组(只要指定列的数据)
下⾯我们来看⼀下这两种⽤法
1、对所有数据进⾏分组
import pandas as pddf = pd.read_excel('C:/Users/cherich/Desktop/forbes_2018.xlsx')groups = df.groupby('gender')print(groups)
2、对指定列进⾏分组(只要指定列的数据)
# 根据gender列只对age列进行分组group = df['age'].groupby(df['gender']) # 查看分组print(group.groups)# 根据分组后的名字选择分组print(group.get