回归模型选择性能指标 | RMSE与MAE应用及其区别（L1-曼哈顿范数和L2-欧几里得范数)

Sany 何灿

已于 2022-03-17 20:05:14 修改

阅读量4.7k

点赞数 5

分类专栏：机器学习理论文章标签：机器学习

于 2020-04-01 00:42:20 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SanyHo/article/details/105235676

版权

机器学习理论专栏收录该内容

30 篇文章

订阅专栏

机器学习回归问题常用的两种选择性能指标：

均方根误差（Root Mean Square Error-RMSE）：
$RMSE(\bold X,h)=\sqrt{\frac{1}{m}\sum_{i=1}^m(h(x^{(i)})-y^{(i)})^2}$

均方根误差测量的是数据序列与真实值之间关系，区别与概率论中的标准差（测量数据序列与均值之间的关系），之所以开平方是为了保证量纲相同。
平均绝对误差（Mean Absolute Error-MAE）
$MAE(\bold X,h)=\frac{1}{m}\sum_{i=1}^m|h(x^{(i)})-y^{(i)}|$

适用情况：数据存在许多异常值时使用MAE，因为当数据异常时，RMSE是先对误差进行平方的累加后再开方，它其实是放大了较大误差之间的差距(代入几组数值即可得出此结论)。而MAE是真实误差，受异常值（极小值或极大值）影响较RMSE小。
两者的异同：
同：
都是测量的预测值和真实值两个向量距离的方法。
异：
（1）RMSE对应于常数与欧几里得范数的乘积，欧几里得范数称为L2范数或 $_2$ ，有时也称作||·||
（2）MAE对应于常数与曼哈顿范数的乘积，曼哈顿范数称为L1范数或 $_1$
【曼哈顿距离（L1范数）& 欧式距离（L2范数）区别】

向量的范数可以简单形象的理解为向量的长度，或者向量到零点的距离，或者相应的两个点之间的距离。
向量的范数定义：向量的范数是一个函数||x||,满足非负性||x|| >= 0，齐次性||cx|| = |c| ||x|| ，三角不等式||x+y|| <= ||x|| + ||y||。
一般情况下，包含n个元素的向量 $\bold v$ 的 $L_k$ 范数（K阶闵氏范数），定义成
$||\bold v||_k=(|v_0|^k+|v_1|^k+···+|v_n|^k)^{\frac{1}{k}}$ 当 $k = 0$ 时，它表示的是这个向量非零元素的个数，称作汉明范数，当 $k\to \infty$ 时，它表示的是向量中最大的绝对值，称作切比雪夫范数。
范数的指数越高，就越关注大的值而忽略小的值。这就是为什么RMSE比MAE对异常值更敏感。但是当异常值是指数分布（类似正态曲线）时，RMSE就表现很好。

参考资料：

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。