常用回归模型评估指标

最新推荐文章于 2024-11-08 13:13:44 发布

ⓟ Paradise

最新推荐文章于 2024-11-08 13:13:44 发布

阅读量417

点赞数

文章标签：回归数据挖掘人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41311624/article/details/131440840

版权

本文总结了各个评估指标的优缺点及其相互关系。

MAE（Mean Absolute Error）

顾名思义，即“绝对误差的均值”：

$MAE=\frac{1}{n}\sum_{i}^{n}|y_i-\hat{y_i}|$

使用 MAE 指标的优点是，计算出的误差指标的量纲与目标变量一致，并且对离群值不敏感。缺点则是由于其函数不可微，不能作为损失函数，因此在不能作为优化器。如果需要最小化 MAE 来拟合回归模型，需要引入其他优化器，如梯度下降。

MSE（Mean Squared Error）

顾名思义，即“平方误差的均值”，在这里顺便了解一下 SSE 的概念：

$MSE=\frac{1}{n}SSE=\frac{1}{n}\sum_{i}^{n}(y_i-\hat{y_i})^2$

其优点是，函数可微，可以作为损失函数。实际上最小二乘回归就相当于使用了这个损失函数（最小二乘法通过最小化 SSE 拟合模型）。其缺点是，误差指标的单位变成原始数据单位的平方，并且对异常值敏感。

RMSE（Root Mean Squared Error）

没啥好说，就是上面提到的单位问题，于是就将 MSE 开平方了。

RMSLE（Root Mean Squared Log Error）

RMSE 存在的问题是，对偏小的预测值惩罚较大，也就是对于不同的误差惩罚不是线性的，因此再取对数，来减小这个问题的影响（实际上没有解决问题）。

R2（R Squared）

R2 又称为拟合优度或确定系数，前面 MSE 已经提到 SSE，这里顺便再提一下 SSR 和 SST：

$R^2=\frac{SSR}{SST}=\frac{\sum_{i}^{n}(\hat{y_i}-\overline{y_i})^2}{\sum_{i}^{n}(y_i-\overline{y_i})^2}$

可以理解为：SSR 为回归方差，SST 为总方差。在统计学中，变异量（即方差）体现了一个随机变量的解释性。因此 R2 的大小体现了预测值对数据变异的解释占总变异的比例，亦即回归模型的好坏。

那么按照这个说法，没有被解释到的去哪里了呢？就在误差 SSE 里面了：

$SST=SSR+SSE$

在这里插入图片描述

Adjusted R2

R2 的缺点是，它只会升不会降。也就是说，你可以在模型中不断添加新的特征，来提高拟合优度（至少不会降低），即使这些新特征是线性不相关的。因此使用 R2 来对比两个具有不同特征数量的模型是不准确的，只试用于单个模型的拟合优度。针对 R2 的这个问题，通过以下式子引入样本量和自由度来进行调整：

$R_a^2=1-\frac{n-1}{n-k-1}(1-R^2)$

其中 n 为样本数，k 为独立变量个数。

阅读原文

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。