- 首先,仅仅分组(groupby)不能产生dataframe对象,产生的是中间结果,在聚合之后,才产生dataframe对象。
- groupby的参数会成为索引,原来的列聚合后依旧保存。
- 内置的聚合函数:sum(), mean(), max(), min(), count(), size(), describe()
- 自定义聚合函数:df.groupby().agg(自定义函数),可以在外边定义好,也可以直接写个lambda。他们的参数是分组后索引对应的每列都会做为输入。
- 上边两条应用的是单个函数,可以多个函数聚合,比如计算man()和min(),那么自然也就可以不同的列用不同的聚合函数.
- 分组后,除了聚合,也可以跟transform(参数跟一个函数,将输出值广播到整个dataframe)、apply等等。
- 参考
pandas分组聚合
最新推荐文章于 2024-01-21 10:08:09 发布