【预测模型--常用度量指标】

本文详细介绍了MAE(平均绝对误差)、MSE(均方误差)、RMSE(均方根误差)和EVS(方差解释分数)以及R2_score(决定系数)在模型评估中的作用。R2_score尤其强调了通过与均值模型对比来理解模型性能。这些指标帮助我们判断模型的准确性,R2_score值越大,模型表现越好。
摘要由CSDN通过智能技术生成

一、MAE(Mean Absolute Error)

        平均绝对误差MAE(MeanAbsolute Error),即误差绝对值的平均值,可以准确反映实际预测误差的大小。

         MAE评估的是真实值和预测值的偏离程度,即预测误差的实际大小。

        MAE值越小,说明模型质量越好,预测越准确。    

二、MSE(Mean Squared Error)

        一般情况下,MSE比较少单独使用,因为不好理解,多数用在方差分析和参数估计等中。

显然,MSE越小,说明模型质量越好,预测越准确

三、RMSE(Root Mean Squared Error)

        均误差平方根RMSE(Root MSE),也称标准误差,是均方误差的算术平方根。

        相比MSE,指标RMSE这个指标与原始数据的量纲是一样的,容易理解,反映真实值与预测值的偏离程度。

        RMSE越小,说明模型质量越好,预测越准确。

四、EVS(Explained Variance Score)

        解释回归模型的方差得分,其值取值范围是[0,1],越接近于1说明自变量越能解释因变量的方差变化,值越小则说明效果越差。

五、R2_score

        那如何比较不同量纲下模型的效果好坏呢?这就需要用到回归模型的第四个评价指标:R方值(R2_score)。

        它的含义就是,既然不同数据集的量纲不同,很难通过上面的三种方式去比较,那么不妨找一个第三者作为参照,根据参照计算 R方值,就可以比较模型的好坏了。

        这个参照是什么呢,就是均值模型。我们知道一份数据集是有均值的,房价数据集有房价均值,学生成绩有成绩均值。现在我们把这个均值当成一个基准参照模型,也叫 baseline model。这个均值模型对任何数据的预测值都是一样的,可以想象该模型效果自然很差。基于此我们才会想从数据集中寻找规律,建立更好的模型。

        R2_score 的计算公式是这样的:


        通过它的取值可以更好理解它是如何评价模型好坏的,有这几种取值情况:

R2_score =  1,达到最大值。即分子为 0 ,意味着样本中预测值和真实值完全相等,没有任何误差。也就是说我们建立的模型完美拟合了所有真实数据,是效果最好的模型,R2_score 值也达到了最大。但通常模型不会这么完美,总会有误差存在,当误差很小的时候,分子小于分母,模型会趋近 1,仍然是好的模型,随着误差越来越大,R2_score 也会离最大值 1 越来越远,直到出现第 2 中情况。

R2_score =  0。此时分子等于分母,样本的每项预测值都等于均值。也就是说我们辛苦训练出来的模型和前面说的均值模型完全一样,还不如不训练,直接让模型的预测值全去均值。当误差越来越大的时候就出现了第三种情况。

R2_score < 0 :分子大于分母,训练模型产生的误差比使用均值产生的还要大,也就是训练模型反而不如直接去均值效果好。出现这种情况,通常是模型本身不是线性关系的,而我们误使用了线性模型,导致误差很大。

理解了 R2_score  后,我们可以对它的计算公式作进一步改进,以便后面编程实现。将分子和分母同除以一个 m,就能得到下式:

         分子是均方误差,分母是方差,都能直接计算得到,从而能快速计算出 R2 值。


总结

- 如果觉得本文对你有所帮助的话,记得点个赞哟~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

想做一只快乐的修狗

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值