用于预测的绝对百分比误差的新度量—MAAPE
引言
平均绝对百分比误差(MAPE)具有尺度独立性和可解释性的优点,是最广泛使用的预测精度指标之一。然而,MAPE具有显著的缺点,即它为零或接近零的实际值产生无限或未定义的值。为了解决MAPE中的这个问题,我们提出了一种新的预测精度测量方法,称为平均反正切绝对百分比误差(MAAPE)。MAAPE是通过从不同角度研究MAPE而开发的。本质上,MAAPE是作为角度的斜率,而MAPE是作为比率的斜率,考虑到三角形的相邻边和相对边分别等于实际值和实际值与预测值之间的差。MAAPE本质上保留了MAPE的原理,通过将比值视为角度而非斜率,以基本的方式使用异常值的有界影响,克服了除以零的问题。
M
A
P
E
=
1
n
∑
i
=
1
n
∣
y
i
^
−
y
i
y
i
∣
MAPE = \frac{1}{n}\sum^{n}_{i=1}|\frac{\hat{y_i}-y_i }{y_i}|
MAPE=n1i=1∑n∣yiyi^−yi∣
M
A
A
P
E
=
1
N
∑
i
=
0
N
−
1
A
A
P
E
i
=
1
N
∑
i
=
0
N
−
1
a
r
c
t
a
n
(
∣
y
i
−
y
i
^
∣
∣
y
i
∣
)
MAAPE = \frac{1}{N}\sum_{i=0}^{N-1}AAPE_i = \frac{1}{N}\sum_{i=0}^{N-1}arctan(\frac{\left| y_i-\hat{y_i} \right|}{\left| y_i \right|})
MAAPE=N1i=0∑N−1AAPEi=N1i=0∑N−1arctan(∣yi∣∣yi−yi^∣)
MAPE与数据多少无关,易于解释,因此深受行业从业者的欢迎。然而MAPE有一个显著的缺点:当实际值为零或接近零时,它会产生无限或未定义的值,这在一些领域中很常见。如果实际值非常小(通常小于1),则MAPE会产生非常大的百分比误差(异常值),而零实际值会导致MAPE无限大。在实践中,在零售、生物和金融等各个领域都观察了大量零值的数据,例如下图,这种数据称为典型的间歇性销售数据
曾经有人试图通过排除实际值小于1或APE值大于MAPE以及另外三个标准差的异常值来解决这个问题,但是这就导致另一个问题,即如何去除异常值。此外,排除异常值可能会扭曲所提供的信息,尤其时当数据涉及许多小的实际值时。为解决这一问题,提出了若干代替措施。Makridakis提出的对称平均绝对百分比误差(sMAPE)是一种修正的MAPE,其中除数是实际值和预测值之和的一半。Hyndman和Koehler提出另一种测量方法,即平均绝对标度误差(MASE)。虽然这些代替措施解决了MAPE的异常问题,但是原始MAPE仍然是商业预测者和从业者的首选方法,因为它在预测文献中很受欢迎,并且它被直观地解释为绝对百分比误差。
首先准确度度量可以分为两组:尺度相关度量和尺度无关度量
尺度相关度量:与规模相关的度量取决于数据规模的度量,均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)和中值绝对误差(MdAE)。与规模相关的意思应该是数据的数量级,不同的数量级之间不能比较MSE等上面提到的度量
尺度无关度量:与数据的数量级大小无关,不同的数量级之间可以按照该度量一同比较
尺度独立被认为是一个好的衡量标准的关键特征
当除数为零时,相对度量可能会有很大的问题
文章路径:不同角度研究MAPE—>MAAPE的措施的行为和理论性质—>探讨MAAPE在比较中的优缺点
不同角度的MAPE:斜率作为比率与斜率作为角度
MAPE是绝对百分比误差
考虑一个三角形,其邻边和相对边分别等于|a|和|a-F|其中a和F分别是实际值和预测值,如下图所示:
我们可以利用斜率测量|a-F|和|a|的比率,范围从零到无穷大;从角度来看,范围是从0到90度,角度
θ
\theta
θ可以用于下面计算
θ
=
a
r
c
t
a
n
(
r
a
t
i
o
)
=
a
r
c
t
a
n
(
∣
A
−
F
A
∣
)
\theta = arctan(ratio) = arctan(|\frac{A-F}{A}|)
θ=arctan(ratio)=arctan(∣AA−F∣)
提出一种新的测量方法,称为平均反正切绝对百分比误差(MAAPE),如下所示:
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
----------------------------
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
为什么使用arctan函数?函数arctanx中x的定义为从负无穷大到无穷大,并且
lim
x
→
∞
t
a
n
−
1
x
=
π
/
2
\lim_{x \to \infty}tan^{-1}x=\pi/2
limx→∞tan−1x=π/2(-1应该是逆函数)。此时
A
A
P
E
AAPE
AAPE的范围是
[
0
,
π
/
2
]
[0,\pi/2]
[0,π/2]
MAAPE的特性
本节比较了MAPE和MAAPE,以研究MAAPE的性质。APE和AAPE是由MAP和MAAPE的组成部分定义的,分别如下等式
。因此在不失一般性的情况下,我们将APE和AAPE进行比较
上图中,上面的两个图表示APE的可视化,下面两个图表示AAPE可视化,实际值(A)和预测值(F)值在0.1到10之间变化,增量为0.1,分别位于x轴和y轴上。在图3(a)中,左上角表示小实际值和大预测值的APE值,右边一列的图表示了APE和AAPE的值。从图中可以看出即使实际值接近零时,AAPE也不会达到无穷大,这是MAAPE相对于MAPE的显著优势,从四个图也可以看出,AAPE对小实际值的敏感性不如APE。
由于APE的值在接近零的实际值时会变得无穷大,因此图中APE和AAPE的详细比较并不容易
为了更加详细地比较APE和AAPE,需要关注从1到10的实际值和预测值
由上图可以发现,MAPE表现不好,因为它对积极错误的处罚和消极错误的处罚不一样,对积极错误的处罚要重得多。【Swanson等人使用对数变换版本的MAPE克服了不是对称分布的问题,但是保留了偏差问题】详细来说,对于F>A时,APE是一个凹向上函数,这意味这不平衡惩罚随着F>A的增加而变得更加严重,这导致APE随着实际值接近零而迅速变大,相反,AAPE比APE变化更小,因为受到arctan极值的影响
下图进一步研究AAPE
X轴表示APE,y轴上比较了三条不同的线:
y
=
a
r
c
t
a
n
(
x
)
,
y
=
x
,
y
=
π
2
−
1
2
y=arctan(x),y=x,y=\frac{\pi}{2}-\frac{1}{2}
y=arctan(x),y=x,y=2π−21
如图所示,对于x的小值,
a
r
c
t
a
n
(
x
)
arctan(x)
arctan(x)的值类似于
y
=
x
y=x
y=x。随着x的增加,它变成了一个非线性函数,最终收敛与
π
2
\frac{\pi}{2}
2π.
对于超过316%(x=3.16)的预测误差,
a
r
c
t
a
n
(
x
)
arctan(x)
arctan(x)和
π
/
2
−
1
/
x
\pi/2-1/x
π/2−1/x之间的差值小于0.01.在许多情况下,超过300%的预测误差可能被视为异常值。对于大的预测误差,AAPE的收敛性在一定程度上限制了异常值的影响,而异常值往往会扭曲整体预测精度的计算。AAPE的这一特性有助于使MAAPE对异常值具有鲁棒性。因此,如果由于错误或不正确的测量导致预测误差非常大,MAAPE可能特别有用
然而,如果超大的预测误差被视为可能具有一些重要业务影响的真实变化,而不是由于错误或不正确的测量,MAAPE将不合适。如下图表一中,简单说明了推荐或不推荐MAAPE的情况
从上表中可以看出,实际值1和实际值2的MAAPE的值没有显著差异,即使它们在时段2的实际值显著不同。因此,如果实际值100和100000都被认为是错误的,或不正确的测量,则MAAPE对这些异常值是稳健的,因此建议使用MAAPE。如果100000的实际值与100的实际值相比有更大的业务影响,MAAPE对这些错误不敏感,因此不建议使用。
MAAPE的另一个限制:如果实际值是零,那么相应的AAPE值总是
π
/
2
\pi/2
π/2,而与预测值无关。Syntetos(2001)指出,sMAPE也有类似的限制:对于零实际值,无论使用何种预测,对称绝对百分比误差总是等于2。
结论
1、MAAPE比MAPE值偏小
2、MAAPE与尺度无关,可以直观地解释为绝对百分比误差,并且计算简单。此外,反正切函数的有界范围允许MAAPE克服MAPE在实际值变为零时变为无穷大的限制
3、MAAPE能够在正负误差之间获得比MAPE更平衡的惩罚,尽管MAAPE的惩罚函数仍然是不对称的
4、由于异常值的有界影响,MAAPE也比MAPE更稳健;因此,MAAPE在由于错误或不正确的观测导致极大误差时尤其有用。然而,如果特大错误被认为具有重要的业务影响,而不仅仅是由于错误的观察,则不建议使用MAAPE