【预测模型--常用度量指标】

想做一只快乐的修狗

已于 2023-03-02 10:16:54 修改

阅读量1.9w

点赞数 34

文章标签： python 机器学习模型预测回归模型评价指标

于 2022-05-02 17:15:46 首次发布

本文链接：https://blog.csdn.net/weixin_44109827/article/details/124542394

版权

本文详细介绍了MAE（平均绝对误差）、MSE（均方误差）、RMSE（均方根误差）和EVS（方差解释分数）以及R2_score（决定系数）在模型评估中的作用。R2_score尤其强调了通过与均值模型对比来理解模型性能。这些指标帮助我们判断模型的准确性，R2_score值越大，模型表现越好。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、MAE（Mean Absolute Error）

平均绝对误差MAE（MeanAbsolute Error），即误差绝对值的平均值，可以准确反映实际预测误差的大小。

MAE评估的是真实值和预测值的偏离程度，即预测误差的实际大小。

MAE值越小，说明模型质量越好，预测越准确。

二、MSE（Mean Squared Error）

一般情况下，MSE比较少单独使用，因为不好理解，多数用在方差分析和参数估计等中。

显然，MSE越小，说明模型质量越好，预测越准确。

三、RMSE（Root Mean Squared Error）

均误差平方根RMSE（Root MSE），也称标准误差，是均方误差的算术平方根。

相比MSE，指标RMSE这个指标与原始数据的量纲是一样的，容易理解，反映真实值与预测值的偏离程度。

RMSE越小，说明模型质量越好，预测越准确。

四、EVS（Explained Variance Score）

解释回归模型的方差得分，其值取值范围是[0,1]，越接近于1说明自变量越能解释因变量的方差变化，值越小则说明效果越差。

五、R2_score

那如何比较不同量纲下模型的效果好坏呢？这就需要用到回归模型的第四个评价指标：R方值（R2_score）。

它的含义就是，既然不同数据集的量纲不同，很难通过上面的三种方式去比较，那么不妨找一个第三者作为参照，根据参照计算 R方值，就可以比较模型的好坏了。

这个参照是什么呢，就是均值模型。我们知道一份数据集是有均值的，房价数据集有房价均值，学生成绩有成绩均值。现在我们把这个均值当成一个基准参照模型，也叫 baseline model。这个均值模型对任何数据的预测值都是一样的，可以想象该模型效果自然很差。基于此我们才会想从数据集中寻找规律，建立更好的模型。

R2_score 的计算公式是这样的：

通过它的取值可以更好理解它是如何评价模型好坏的，有这几种取值情况：

R2_score = 1，达到最大值。即分子为 0 ，意味着样本中预测值和真实值完全相等，没有任何误差。也就是说我们建立的模型完美拟合了所有真实数据，是效果最好的模型，R2_score 值也达到了最大。但通常模型不会这么完美，总会有误差存在，当误差很小的时候，分子小于分母，模型会趋近 1，仍然是好的模型，随着误差越来越大，R2_score 也会离最大值 1 越来越远，直到出现第 2 中情况。

R2_score = 0。此时分子等于分母，样本的每项预测值都等于均值。也就是说我们辛苦训练出来的模型和前面说的均值模型完全一样，还不如不训练，直接让模型的预测值全去均值。当误差越来越大的时候就出现了第三种情况。

R2_score < 0 ：分子大于分母，训练模型产生的误差比使用均值产生的还要大，也就是训练模型反而不如直接去均值效果好。出现这种情况，通常是模型本身不是线性关系的，而我们误使用了线性模型，导致误差很大。

理解了 R2_score 后，我们可以对它的计算公式作进一步改进，以便后面编程实现。将分子和分母同除以一个 m，就能得到下式：