MAPE(Mean Absolute Percentage Error,平均绝对百分比误差)是一种常用的评价回归模型预测精度的指标。它衡量了预测值与真实值之间的差异,以百分比的形式表达。MAPE 越接近于 0%,说明模型的预测性能越好。
MAPE 的定义
MAPE 的计算公式如下:
$ \text{MAPE} = \frac{1}{n} \sum_{t=1}^{n} \left| \frac{y_t - \hat{y}_t}{y_t} \right| \times 100% $
其中:
- ( n ) 是观测的数量;
- ( y_t ) 是第 ( t ) 个观测的实际值;
- $ \hat{y}_t $ 是第 ( t ) 个观测的预测值。
计算步骤
- 对于每一个观测值,计算预测值与实际值之间的差值。
- 将差值除以实际值,得到相对误差。
- 对相对误差取绝对值,得到绝对百分比误差。
- 计算所有观测值的绝对百分比误差的平均值,即得到 MAPE。
特点和限制
优点
- 易于理解和解释:MAPE 的结果以百分比形式给出,容易被非专业人员理解。
- 尺度无关性:MAPE 不受数据尺度的影响,使得不同尺度的数据可以直接比较其预测性能。
缺点
- 对零值敏感:当实际值 $ y_t $ 接近于零时,分母接近于零会导致 MAPE 变得非常大甚至无法计算。
- 偏向性:MAPE 对过小的预测值更为敏感,因为它使用了绝对值,这意味着预测值远小于实际值时,MAPE 会非常高。
- 非对称性:MAPE 对于过高或过低的预测值不是对称的。例如,预测值是实际值的两倍和实际值的一半,其 MAPE 是不一样的。
- 可能被误解:即使 MAPE 很低,也可能存在系统偏差,即模型总是倾向于预测过高或过低。
应用场景
MAPE 常用于金融、销售预测、天气预报等领域,特别是在需要直观理解预测偏差的场合。然而,在处理可能包含零值或极小值的数据集时,应谨慎使用 MAPE,因为这些情况可能导致 MAPE 的计算结果不可靠。
替代指标
由于 MAPE 的局限性,有时会使用其他指标来补充或替代 MAPE,例如:
- 均方误差(MSE,Mean Squared Error)
- 均方根误差(RMSE,Root Mean Squared Error)
- 平均绝对误差(MAE,Mean Absolute Error)