第3章 衡量线性回归的指标:MSE,RMSE,MAE

本文详细解读了简单线性回归的目标,介绍了MSE、RMSE、MAE等评估标准,包括它们的量纲、特点及在分类精度中的应用。重点讲解了R²(决定系数),展示了其在模型性能评估中的关键作用,从0到1的范围解释了模型优劣。同时涵盖了基准模型和R²的计算公式。
摘要由CSDN通过智能技术生成

简单线性回归:目标:找到a和b,使得 ∑ i = 1 m ( y t r a i n ( i ) − a x t r a i n ( i ) − b ) 2 \sum_{i=1}^m(y_{train}^{(i)}-ax_{train}^{(i)}-b)^2 i=1m(ytrain(i)axtrain(i)b)2尽可能小

线性回归算法的评测:

衡量标准: ∑ i = 1 m ( y t e s t ( i ) − y ^ t e s t ( i ) ) 2 \sum_{i=1}^m(y_{test}^{(i)}-\hat{y}_{test}^{(i)})^2 i=1m(ytest(i)y^test(i))2,问题:和m相关?

1)均方误差MSE(Mean Squared Error)问题:量纲?
1 m ∑ i = 1 m ( y t e s t ( i ) − y ^ t e s t ( i ) ) 2 \frac1m\sum_{i=1}^m(y_{test}^{(i)}-\hat{y}_{test}^{(i)})^2 m1i=1m(ytest(i)y^test(i))2
2)均方根误差RMSE(Root Mean Squared Error)
1 m ∑ i = 1 m ( y t e s t ( i ) − y ^ t e s t ( i ) ) 2 = M S E t e s t \sqrt{\frac1m\sum_{i=1}^m(y_{test}^{(i)}-\hat{y}_{test}^{(i)})^2}=\sqrt{MSE_{test}} m1i=1m(ytest(i)y^test(i))2 =MSEtest
3)平方绝对误差MAE(Mean Absolute Error)
1 m ∑ i = 1 m ∣ y t e s t ( i ) − y ^ t e s t ( i ) ∣ \frac1m\sum_{i=1}^m\mid y_{test}^{(i)}-\hat{y}_{test}^{(i)}\mid m1i=1mytest(i)y^test(i)
问题:分类的准确度:1最好,0最差
4)R Squared
R 2 = 1 − S S r e s i d u a l S S t o t a l R^2=1-\frac{SS_{residual}}{SS_{total}} R2=1SStotalSSresidual
Residual Sum of Squares;Total Sum of Squares
R 2 = 1 − ∑ i ( y ^ ( i ) − y ( i ) ) 2 ∑ i ( y ˉ − y ( i ) ) 2 R^2=1-\frac{\sum_i(\hat{y}^{(i)}-y^{(i)})^2}{\sum_i(\bar{y}-y^{(i)})^2} R2=1i(yˉy(i))2i(y^(i)y(i))2
分子:使用我们的模型预测产生的错误;
分母:使用 y = y ˉ 预 测 产 生 的 错 误 y=\bar{y}预测产生的错误 y=yˉ
Baseline Model

1. R 2 ≤ 1 R^2\leq 1 R21
2. R 2 R^2 R2越大越好。当我们的预测模型不犯任何错误时, R 2 R^2 R2得到最大值1;
3.当我们的模型等于基准模型时, R 2 R^2 R2为0;
4.如果 R 2 < 0 R^2<0 R2<0,说明我们学习到的模型还不如基准模型。此事,很有可能我们的数据不存在任何线性关系。
R 2 = 1 − ∑ i ( y ^ ( i ) − y ( i ) ) 2 ∑ i ( y ˉ − y ( i ) ) 2 R^2=1-\frac{\sum_i(\hat{y}^{(i)}-y^{(i)})^2}{\sum_i(\bar{y}-y^{(i)})^2} R2=1i(yˉy(i))2i(y^(i)y(i))2
= 1 − ( ∑ i m ( y ^ ( i ) − y ( i ) ) 2 ) / m ( ∑ i m ( y ˉ − y ( i ) ) 2 ) / m =1-\frac{(\sum_i^m(\hat{y}^{(i)}-y^{(i)})^2)/m}{(\sum_i^m(\bar{y}-y^{(i)})^2)/m} =1(im(yˉy(i))2)/m(im(y^(i)y(i))2)/m
= 1 − M S E ( y ^ , y ) V a r ( y ) =1-\frac{MSE(\hat{y},y)}{Var(y)} =1Var(y)MSE(y^,y)

回答: 在回归模型中,我们可以使用MAE(平均绝对误差),MSE(均方误差)和RMSE(均方根误差)来评估模型的性能。MAE是预测值与实际值之间差值的绝对值的平均值,MSE是预测值与实际值之间差值的平方的平均值,而RMSEMSE的平方根。\[1\]通常情况下,我们希望这些误差越小越好,因为它们表示了模型的预测与实际值之间的差异程度。因此,当我们比较不同的回归模型时,我们可以使用这些指标来判断模型的好坏。如果MAEMSERMSE都较小,那么我们可以认为该回归模型较好。\[1\]此外,我们还可以使用残差图来评估回归模型的适用性。如果数据点在没有图案的线上随机分布,那么线性回归模型非常适合数据,否则我们应该考虑使用非线性模型。\[2\] #### 引用[.reference_title] - *1* *2* [回归问题的评价指标 MAE MSE RMSE R2 score Adjusted R2 score 和 重要知识点总结](https://blog.csdn.net/HzauTriste/article/details/127562028)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [回归模型评估指标MAEMSERMSE、R²、MAPE)](https://blog.csdn.net/y15659037739l/article/details/123971286)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值