pandas中apply(),transform(),agg()使用心得

strive_one

已于 2022-08-01 10:26:18 修改

阅读量1.3k

点赞数 1

分类专栏： pandas 文章标签： python

于 2021-09-15 15:47:10 首次发布

本文链接：https://blog.csdn.net/Learn_and/article/details/120309850

版权

1 篇文章 0 订阅

订阅专栏

本文介绍了Pandas中agg(), transform(), apply()函数在数据分组处理中的应用，重点讲述了它们的使用方法、内置函数支持、输出类型差异，以及计算速度对比。特别指出自定义函数与内置方法的效率区别，以及何时选择哪种方法以提高性能。

摘要由CSDN通过智能技术生成

使用方法：df.groupby([‘id’, ‘name’])[‘price’, ‘price_’].agg(‘count’)
agg() / transform()方法可以反射调用（str调用）‘sum‘、‘max’、‘min’、'count‘等方法，形如agg(‘sum’)。apply不能直接使用，而可以用自定义函数+列特征的方法调用。

agg、apply运算groupby的数据完直接赋给原生df数据某字段报错
transform运算groupby的数据完直接赋给原生df数据某字段不会报错
agg，transform和apply三个方法的输入对象，都是分组后的DataFrame/Series，区别在于，他们的输出类型不一样，agg输出的是缩减后的标量（或者标量列表）；transform输出的是原输入的DataFrame大小的，但是数据元素经过了转换的DataFrame；apply就很灵活了，它既可以是缩减后的标量，也可以是pandas对象（注意这里是pandas对象哦，并不仅仅是DataFrame哦）。