性能度量RMSE

最新推荐文章于 2024-07-26 09:53:57 发布

weixin_30794499

最新推荐文章于 2024-07-26 09:53:57 发布

阅读量790

点赞数

原文链接：http://www.cnblogs.com/nativestack/p/ml_rmse.html

版权

回归问题的典型性能度量是均方根误差（RMSE:Root Mean Square Error）。如下公式。

m为是你计算RMSE的数据集中instance的数量。
x⁽ⁱ⁾是第i个实例的特征值向量 ,y⁽ⁱ⁾是其label（期望的模型输出）。如下：
X是包含了所有实例的特征值（不包含label）的矩阵。每行代表一个实例，并且每行等于x⁽ⁱ⁾向量的转置：(x⁽ⁱ⁾)^T。下图矩阵中的第一行为2中向量的转置（列向量变为行向量）。
h是预测函数，当输入是某实例的特征向量x⁽ⁱ⁾，应用函数之后，结果为ŷ⁽ⁱ⁾=h(x⁽ⁱ⁾). ŷ也叫作y-hat. 比如：对第一个实例应用函数h后结果为158400，即ŷ⁽¹⁾=h(x⁽¹⁾)=158400。那么预测误差/错误为ŷ⁽¹⁾-y⁽¹⁾= 158400 - 156400 = 2000.
RMSE(X,h) 是在数据集X上应用于函数h计算的cost function。

以上，我们使用小写斜体表示标量(m,y⁽ⁱ⁾)，函数名(h)。小写粗体表示向量(x⁽ⁱ⁾). 大写粗体表示矩阵(X).

还有一种度量方法为： Mean Absolute Error. 理解起来也比较简单。

下面是一张图，通过线性关系生动解释了RMSE。4个黑色的点是数据集（包括标签），蓝色的线是我们的预测函数h: ŷ=2.50x-2。从而可以求出RMSE为0.707.与之前不同的是这里取m为3(m-1)而不是4。

结论： RMSE越小，说明模型越fit数据。

转载于:https://www.cnblogs.com/nativestack/p/ml_rmse.html

weixin_30794499

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。