机器学习：预测评估8类指标

最新推荐文章于 2025-04-17 15:02:07 发布

spssau

最新推荐文章于 2025-04-17 15:02:07 发布

阅读量4.1k

点赞数 32

分类专栏：统计学机器学习文章标签：数据分析机器学习 spss 预测评估指标

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37228052/article/details/140146001

版权

统计学同时被 2 个专栏收录

161 篇文章

订阅专栏

1 篇文章

订阅专栏

机器学习：8类预测评估指标

R方值、平均值绝对误差值MAE、均方误差MSE、均方误差根EMSE、中位数绝对误差MAD、平均绝对百分误差MAPE、可解释方差分EVS、均方根对数误差MLSE。

一、R方值

1、说明：

R方值，也称为确定系数或拟合优度，是用于量化模型预测与真实数据之间拟合程度的指标。其值范围在0到1之间。

R方值接近0：表示模型几乎没有解释数据中的变化，即模型的预测与真实值之间几乎没有关系。
R方值接近1：表示模型解释了数据中的大部分变化，即模型的预测与真实值非常接近。

2、计算：

SST：是真实值与其均值之间差异的平方和，反映了数据中的总变化。

SSR：回归平方和，即回归模型可以解释的方差。它表示由自变量变化引起的因变量变化的部分，是可以用回归直线来解释的变差部分。

3、解读说明：

R方值过高：
通常表示模型拟合得很好，能够解释数据中的大部分变化。但需要注意，高R方值并不一定意味着模型具有好的预测能力，特别是在存在过拟合的情况下。
R方值过低：
可能表示模型拟合得不好，或者数据中的变化主要由随机噪声引起，而非模型能够解释的系统性规律。
R方值的比较：

在比较不同模型的R方值时，需要注意数据的规模和特征。对于具有不同规模或特征的数据集，即使R方值相同，也可能表示模型具有不同的拟合能力。

二、平均绝对误差值MAE

1、说明：

预测值与实际值之差的绝对值的平均数，取值越小，模型准确度越高。

2、计算：

MAE=1𝑛∑𝑖=1𝑛|𝑦𝑖−𝑦^𝑖|

其中，n为样本个数，为真实值，为预测值。

3、解读说明：

直观易懂：
MAE是一个直观且易于理解的指标，因为它以与原始数据相同的单位来衡量误差。
对异常值不敏感：
由于MAE取的是绝对误差的平均值，因此它对数据中的异常值或极端值不敏感。这意味着即使数据中存在一些异常值，MAE值也不会受到太大的影响。
评估预测精度：
MAE直接反映了模型的预测精度，因为它衡量的是预测值与真实值之间的平均绝对差异。较小的MAE值表示模型具有更高的预测准确性。
不受数据集规模影响：
MAE是一个相对稳定的指标，它不受数据集规模的影响。因此，无论是在小数据集还是大数据集上，MAE都可以提供一致的评估结果。
三、均值误差MSE
1、说明：
预测值与实际值之差的平方的平均值。取值越小，模型准确度越高。
2、计算：
MSE=1𝑛∑𝑖=1𝑛(𝑦𝑖−𝑦^𝑖)2
其中，n为样本个数，为真实值，为预测值。
3、解读说明：
敏感性：

MSE对预测误差的大小非常敏感，即使是较小的误差也会对MSE值产生较大的影响。因此，它能够有效反映模型的预测能力。

计算简单：

MSE的计算公式相对简单，易于理解和实现。

对离群值敏感：

MSE的一个主要缺点是它对数据中的离群值非常敏感。如果数据集中存在离群值，MSE的值可能会受到显著影响，导致对模型性能的评估不准确。

四、误差根RMSE

1、说明：

为 MSE 的平方根，取值越小，模型准确度越高。

2、计算：

RMSE=1𝑛∑𝑖=1𝑛(𝑦𝑖−𝑦^𝑖)2

其中，n为样本个数，为真实值，为预测值。

3、解释说明：

敏感性：

RMSE对预测误差的大小非常敏感，即使是较小的误差也会对RMSE值产生较大的影响。这有助于发现模型中的小偏差。

量纲一致性：

RMSE的单位与原始数据的单位相同，因此具有量纲一致性，便于理解和解释。

对离群值敏感：
由于RMSE计算中涉及到平方操作，因此它对数据中的离群值非常敏感。如果数据集中存在离群值，RMSE的值可能会受到显著影响。
数值范围：

RMSE的取值范围是0到正无穷大。数值越小，表示模型的预测精度越高

五、数绝对误差MAD

说明

有异常值也可以使用。

[1]李文颖.基于深度学习的金融市场波动率预测研究及应用[D].东华大学,2023.DOI:10.27012/d.cnki.gdhuu.2023.000710.

六、平均绝对百分误差MAPE

1、说明：

预测值与实际值之差的绝对值与实际值之比的平均数，以百分比表示。取值越小，模型准确度越高。

2、判断标准：

MAPE取值范围是0到正无穷大。

在这个范围内，MAPE值越小，表示预测模型越准确，预测值与实际值之间的误差越小。

MAPE值小于10%：通常认为这是一个比较好的预测模型，预测精度较高。

MAPE值在10%-20%之间：预测精度仍然可以接受，但可能需要进行一些优化以提高准确性。

MAPE值大于20%：这表示预测效果不太理想，可能需要重新评估模型或寻找更好的预测方法。

七、可解释方差得分EVS

1、说明：

可解释方差得分（EVS）是衡量回归模型预测结果与实际结果之间方差相似度的一个指标。它反映了模型捕捉到的数据变异性的程度，即模型预测值的变化与实际值变化之间的相似度。

2、计算：

EVS = 1 - (ESS / TSS)

ESS:回归平方和、TSS总体平方和。

3、判断标准：

可释方差得分的取值范围为[0,1]，当EVS为1时，表示模型完美预测了数据；当EVS为0时，表示模型无法解释数据方差。

在实际应用中，EVS通常用于比较不同模型的表现，取值越接近1，表示模型解释的数据方差越多，表现越好。

八、均方根对数误差MSLE

1、说明和计算：

计算的是预测值与实际值之间的对数差的平方的平均值，再取平方根。

2、判断标准：

敏感性：
MSLE对于预测值与实际值之间的比例误差非常敏感。当预测值与实际值相差很大时，即使它们的绝对值差异可能不大，MSLE也会给出一个较大的值，从而惩罚模型。
对数据的分布敏感：

由于MSLE涉及到对数运算，因此它对数据的分布非常敏感。如果数据中存在大量的极端值或离群点，那么MSLE可能会给出不稳定的结果。

机器学习：预测评估8类指标

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。