深度学习:MAE 和 RMSE 详解

平均绝对误差(MAE)和均方根误差(RMSE)是评估模型精度的重要指标。MAE是误差绝对值的平均,对异常值不敏感;RMSE是平方误差的平方根,受异常值影响大。在女朋友守时的例子中,RMSE更能体现异常值(如大幅度迟到)的影响,适合衡量进步。选择MAE还是RMSE取决于是否关注异常值的影响。
摘要由CSDN通过智能技术生成

平均绝对误差MAE(mean absolute error) 和均方根误差 RMSE(root mean squared error)是衡量变量精度的两个最常用的指标,同时也是机器学习中评价模型的两把重要标尺
那两者之间的差异在哪里?它对我们的生活有什么启示?

一、定义

平均绝对误差MAE(mean absolute error)是绝对误差的平均值,它其实是更一般形式的误差平均值。
因为如果误差是[-1,0,1],平均值就是0,但这并不意味之系统不存在误差,只是正负相互抵消了,因此我们要加上绝对值。它的定义表达式为:
在这里插入图片描述
换成更直接的表达式:
在这里插入图片描述
而均方根误差 RMSE(root mean squared error),也有资料称为RMSD,也可以测量误差的平均大小,它是预测值和实际观测之间平方差异平均值的平方根

它的定义为:
在这里插入图片描述
换成更直接的表达式为:
在这里插入图片描述

二、比较

只是看这些抽象的公式,很难帮我们理解它们之间的差异,让我们来用一个实际的例子说明:

假设你想了解量女朋友在准时方面的特点,你统计了近两个月女朋友约会的迟到时间(即是实际到达时间和约定时间的差距,或误差,单位可以是分钟,时间有夸大,我们只想你更好理解概念),如下:
第一个月迟到时间1 = ([5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 1000])
第二个月迟到时间2= ([5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10])

那么我们来计算两个序列的平均绝对误差MAE和均方根误差RMSE。

我们计算得出:
对于第一个月:平均绝对误差 MAE1 = 62.5分钟,均方根误差 RMSE1:235.82 分钟
对于第二个月:平均绝对误差 MAE2 = 7.5分钟,均方根误差RMSE2 = 7.91分钟

第一个月的平均绝对误差 MAE(62.5) 与均方根误差 RMSE(235.82) 之比接近1:4,
第二个月迟到时间的平均绝对误差 MAE (7.5) 与均方根误差 RMSE(7.91)之比约为1:1。

我们应该用哪个量衡量女朋友守时呢?
我们看到均方根误差 RMSE 受异常值的影响更大。
如果我们去评判女朋友守时方面的进步,用RMSE标准,我们更可以看到她的进步之大,也许更要奖励她一顿饕餮盛宴。

一般来说,我们应该期望 MAE 值比 RMSE 值小得多。
因为对于均方根误差RMSE,每个误差都是平方的。
这意味着单个误差呈二次增长,并且对最终RMSE值有不同的影响。

这两组误差序列之间的惟一区别是序列1中的极值是1000,而不是10。
因此,我们看到较大的异常值对均方根误差RMSE的影响更大。

三、应用

当我们处理较大的数据集时,我们不能检查每个值以了解是否有一个或一些异常值,或者是否所有的错误都系统性地更高。

查看 MAE 和 RMSE 的比值可以帮助我们理解是否存在较大但不常见的错误。

另外,在生活中,如果想准确的衡量一个人的进步有多大,以便造就和坚固TA的进步,你知道应该选择哪一副眼镜去看待了么?

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值