[机器学习] 衡量线性回归效果的评价指标： R-squared 和调整R方

最新推荐文章于 2024-07-24 17:32:21 发布

库乐

最新推荐文章于 2024-07-24 17:32:21 发布

阅读量7.1k

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43574374/article/details/120110154

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

常用的衡量线性回归效果的评价指标:

R-squared
- 调整R方(Adjested R-square)

在这里插入图片描述

直线拟合所有点的好坏程度，可以用“R方”来评估。

R-squared

结论： $\mathbf{R^2\leq1}$ ，且R方越接近1越好！

原理：假设模型预测结果为 $\hat{y}$ ，真实结果为 $y$ ，真是结果的平均数为 $\bar{y}$ :

$R^2 = 1-\frac{\sum_i {(\hat{y}_{i}-{y}_{i})^2 } } {\sum_i {(\bar{y}-{y}_{i})^2 }}$
分子：模型预测产生的错误
分母：假设有一个标准模型，预测出来的值为真实值的平均数（最基准的模型 Baseline Model）

最理想的情况是所有点都落在线上，即：
对于每一点 $x_i$ ， $\hat{y_i}=y_i$ ，此时，分子为0， $R^2=1$
当 $\hat{y_i}$ 的平均数 = $\bar{y}$ 时，分子=分母， $R^2=0$

即这里 $\frac{\hat{y_1}+\hat{y_1}+\hat{y_1}}{3}=\frac{y_1+y_2+y_3}{3}$
拟合程度特别差，直线远离所有的点，分子无限大

所以这里分子是一定≥分母的， $R^2\in(-\infty, 1]$ ，且越接近1越好。

PS：分子称为RSS残差平方和，分母为TSS平方和

调整R方(Adjested R-square)

结论： $0\leq \mathbf{R^2_{adjusted}\leq1}$ ，且越接近1越好！
当有n个样本，p为特征数量，
$R^2_{adjusted} = 1-\frac{(1-R^2)(n-1)}{n-p-1}$

当增加特征数量时， $R^2$ 增加。因为

加入的有效特征越多，对因变量Y的描述也就越细致，自然，方程预测的准确性就越高，也就是说增加特征会让回归函数拟合得更好。

特征越多，自变量集合元素越多，自变量集合对因变量的解释程度越高，几何上表现为样本点在回归直线附近越密集，即拟合度越好，R方越大。

当增加特征数量时， $R^2$ 没有显著增加，调整 $R^2$ 变小
当增加特征数量时， $R^2$ 显著增加，调整 $R^2$ 变大

关注

0
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
[机器学习] 衡量线性回归效果的评价指标： R-squared 和调整R方

常用的衡量线性回归效果的评价指标:R-squared调整R方(Adjested R-square)直线拟合所有点的好坏程度，可以用“R方”来评估。R-squared结论：R2≤1\mathbf{R^2\leq1}R2≤1，且R方越接近1越好！原理：假设模型预测结果为y^\hat{y}y^，真实结果为yyy，真是结果的平均数为yˉ\bar{y}yˉ:R2=1−∑i(y^i−yi)2∑i(yˉ−yi)2R^2 = 1-\frac{\sum_i {(\hat{y}_{i}-{y}_{i})^2
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。