Pandas2.2 DataFrame
Computations descriptive stats
方法 | 描述 |
---|---|
DataFrame.abs() | 用于返回 DataFrame 中每个元素的绝对值 |
DataFrame.all([axis, bool_only, skipna]) | 用于判断 DataFrame 中是否所有元素在指定轴上都为 True |
DataFrame.any(*[, axis, bool_only, skipna]) | 用于判断 DataFrame 中是否至少有一个元素在指定轴上为 True |
DataFrame.clip([lower, upper, axis, inplace]) | 用于截断(限制)DataFrame 中的数值 |
DataFrame.corr([method, min_periods, …]) | 用于计算 DataFrame 中各列之间的相关系数矩阵(Correlation Matrix) |
DataFrame.corrwith(other[, axis, drop, …]) | 用于计算当前 DataFrame 的每一列(或行)与另一个 Series 或 DataFrame 中对应列的相关系数 |
DataFrame.count([axis, numeric_only]) | 用于统计 DataFrame 中每列或每行的非空(非 NaN)元素数量 |
DataFrame.cov([min_periods, ddof, numeric_only]) | 用于计算 DataFrame 中每对列之间的协方差 |
DataFrame.cummax([axis, skipna]) | 用于计算 DataFrame 中每列或每行的累计最大值(cumulative maximum) |
DataFrame.cummin([axis, skipna]) | 用于计算 DataFrame 中每列或每行的累计最小值(cumulative minimum) |
DataFrame.cumprod([axis, skipna]) | 用于计算 DataFrame 中每列或每行的累计乘积(cumulative product) |
DataFrame.cumsum([axis, skipna]) | 用于计算 DataFrame 中每列或每行的累计和(cumulative sum) |
pandas.DataFrame.cumsum()
pandas.DataFrame.cumsum()
方法用于计算 DataFrame 中每列或每行的累计和(cumulative sum)。该方法返回一个与原 DataFrame 形状相同的对象,每个位置上的值是到该位置为止所有元素的累加和。
参数说明:
-
axis:{0 or ‘index’, 1 or ‘columns’}, default 0
- 指定计算方向:
0
或'index'
:按列计算(对每一列从上往下累计)1
或'columns'
:按行计算(对每一行从左往右累计)
- 指定计算方向:
-
skipna:bool, default True
- 如果为
True
,则忽略 NaN 值; - 如果为
False
,遇到 NaN 则结果也为 NaN。
- 如果为
示例代码 1:默认参数(按列累计和)
import pandas as pd
df = pd.DataFrame({
'A': [1, 2, 3, 4],
'B': [10, 20, 30, 40]
})
result = df.cumsum()
print(result)
输出结果:
A B
0 1 10
1 3 30
2 6 60
3 10 100
示例代码 2:按行累计和(axis=1)
result = df.cumsum(axis=1)
print(result)
输出结果:
A B
0 1 11
1 2 22
2 3 33
3 4 44
示例代码 3:包含 NaN 值时 skipna=False 的影响
import numpy as np
df_with_nan = pd.DataFrame({
'A': [1, 2, None, 4],
'B': [None, 2, 3, 4]
})
result = df_with_nan.cumsum(skipna=False)
print(result)
输出结果:
A B
0 1.0 NaN
1 3.0 NaN
2 NaN NaN
3 NaN NaN
总结:
cumsum()
是数据分析中非常常用的函数,适用于追踪数据随时间或其他维度的累积变化。- 常用于财务、统计、信号处理等领域,如计算累计销售额、累计收益、积分信号等。