简介
Pandas(Python)中的transform函数一开始可能有点难以理解,并且大多数数据科学家不会马上使用到它。 但对于数据科学家来说,transform函数是一个用于数据清洗、转换或者生成报表的非常方便的工具,尤其是对于大量数据的处理速度上。
应用实例
考虑这样一个例子,我们有来自某商店的表格如下:
而我们希望生成一个新列,统计每个用户的平均购买额,如下:
我们起码有两种方法实现这个操作:
- 先采用groupby计算平均并生成一个新的dataframe,再和上一个dataframe进行merge
- 采用transform函数
第一种方法:
import pan