该函数是一个用于pandas中用于聚合(组合)数据之后再进行计算的函数。简单说就是,依据一列或几列把数据合并,再对合并之后的其他列的数据进行操作。
Series.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False, **kwargs)
by: mapping, function, label, list of label. 聚合的依据,
axis: default 0: 按列聚合;1 按行聚合
level: 如果数据的index有多层的话,可根据这个参数按index聚合,参数可以是int,也可以是index的name
return: groupby object
这个函数是数据前处理中非常非常常用的,可以把使用过程分为三个步骤:
分组(把数据按某个特征聚合分组),
操作(把分组后的数据按一定的函数独立地处理),
组合(再把处理过的数据组合