1.分组与聚合原理
在Pandas中,分组是指使用特定的条件将原数据划分为多个组,聚合在这里指的是,对每个分组中的数据执行某些操作,最后将计算的结果进行整合。
三步骤:1.拆分 2.应用 3.合并
2.通过groupby【】方法groupby
(by=None, axis=0, level=None, as_index=True, sort=True,group_keys=True, squeeze=False, observed=False, **kwargs)
by:用于确定进行分组的依据。 axis:表示分组轴的方向。 sort:表示是否对分组标签进行排序,接收布eries调用groupby()方法返回的是
SeriesGroupBy对象。 使用DataFrame调用groupby()方法返回的是DataFrameBy对象。尔值,默认为True。
按列名进行分组
ataFrame对象的某一列数据符合划分成组的标准,则可以将该列当做分组键来拆分数据集。
df.groupby(by='Key')
group_obj = df.groupby('Key') # 遍历分组对象 for i in group_obj:
print(i)则可以使用for循环遍历DataFrameGroupBy对象。
series分组
ser_obj = pd.Series(['a', 'b', 'c', 'a', 'b']) # 按自定义Series对象进行分组
group_obj = df.grou