一、分组模式及其对象
- 分组的一般模式
要实现分组操作,必须明确三个要素: 分组依据 、 数据来源 、 操作及其返回结果 。同时从充分性的角度来说,如果明确了这三方面,就能确定一个分组操作,从而分组代码的一般模式即:
df.groupby(分组依据)[数据来源].使用操作
例如:要实现依据“性别”分组,统计全国人口 “寿命”的“平均值”
代码为
df.groupby('Gender')['Longevity'].mean()
想要按照性别统计身高中位数,代码如下:
df = pd.read_csv('../data/learn_pandas.csv')
df.groupby('Gender')['Height'].median()
2.分组依据的本质(多个维度分组)
groupby是实习的时候写SQL用的最不好的一个函数,希望这