DataFrame.apply(func[, axis, raw, …]) | 为整个DataFrame/行/列应用func函数(作用域为Series) |
DataFrame.applymap(func[, na_action]) | 为DataFrame的每个元素应用func函数(作用域为元素) |
DataFrame.agg([func, axis]) | 按列使用指定方法聚合所有行,如:
df.agg(['sum', 'min'])将df的所有行按列求sum值和min值;
df.agg({'A' : ['sum', 'min'], 'B' : ['min', 'max']})将A列按sum,min聚合,将B列按min,max聚合 |
DataFrame.aggregate([func, axis]) | 同上 |
DataFrame.transform(func[, axis]) | 将指定方法应用到DataFrame的行/列,默认行,如:
df.transform(lambda x: x + 1)按行将df中的每个元素+1;
df.transform([np.sqrt, np.exp])按行计算df中每个元素的平方根和e次幂; |
DataFrame.groupby([by, axis, level, …]) | 将DataFrame按指定列进行分组,一般和sum(),mean()等一起使用,如:
df.groupby('col2').sum()将df按第2列的值分组求和 |
DataFrame.rolling(window[, min_periods, …]) | 按行或列(默认行)提供滚动窗口计算,如:
df2=df1.rolling(window=3, center=True,min_periods=1).sum()按行滑动以每个元素为中心得到大小为3的窗口,计算sum |
DataFrame.expanding([min_periods, center, …]) | 提供扩展转换,统计每个元素之前所有可用的数据,如:
df.expanding(2).sum()按行将每个元素替换为之前所有元素的和,当前面元素小于1时取NAN |
DataFrame.ewm([com, span, halflife, alpha, …]) | 提供指数加权(EW)函数 |