常用回归问题评估方法

     

回归问题中的测评函数公式(y为实际值;\bar{y}为实际值的平均值;\hat{y}为预测值;n为样本数量;k 为模型中的自变量数,不包括常数项)Sklearn的API
MAE(平均绝对误差)\frac{1}{n}\sum_{i=1}^{n}\left | y_{i}-\hat{y}_{i} \right |
from sklearn.metrics import mean_absolute_error
mean_absolute_error(y_test,y_predict)

 
MSE(均方误差)\frac{1}{n}\sum_{i=1}^{n}\left ( y_{i} -\hat{y}_{i}\right )^2
from sklearn.metrics import mean_squared_error
mean_squared_error(y_test,y_predict)

RMSE(均方根误差)\sqrt{\frac{1}{n}\sum_{i=1}^{n}\left ( y_{i} -\hat{y}_{i}\right )^2}RMSE 是 MSE 的平方根
R^{2}(绝定系数)1-\frac{\sum (y_{i}-\hat{y}_{i})^2}{\sum(y_{i}-\bar{y}_{i})^2}
from sklearn.metrics import r2_score
r2_score(y_test,y_predict)

AdjustedR^{2}1-\frac{(1-R^{2})(n-1)}{n-k-1}调整后的R^{2}

        一般使用MAE和RMSE这两个指标

  • MAE(平均绝对误差)

    • 直接反映平均误差:MAE 提供了预测值和真实值之间的平均误差大小,易于解释。
    • 鲁棒性:对大误差的敏感度较低,较少受极端值(outliers)的影响。
    • 不区分误差大小:MAE 对所有误差一视同仁,无法强调较大误差,可能掩盖了模型在特定情况下的不足。
    • 敏感性低:对于需要突出大误差影响的应用场景,MAE 的敏感性不足。
  • RMSE(均方根误差)

    • 强调大误差:通过平方项,RMSE 放大了较大误差的影响,有助于识别预测中误差较大的情况。
    • 平滑性:通常在数学和统计模型评估中广泛使用,因为它更符合正态分布假设下的误差处理。
    • 对极端值敏感:由于平方项的存在,RMSE 对异常值(outliers)极其敏感,可能导致对模型整体性能的误导性评估。
    • 复杂性:相比 MAE,RMSE 的平方和开方操作使得解释复杂度增加,尤其在非技术背景下难以直观理解。
  • \mathbf{R^{2}} 评价标准
    • R^{2}<0.5:模型拟合较弱,说明模型解释变量变异的能力较差。
    • 0.5 \leq R^{2}\leq 0.8:模型拟合中等,模型有一定的解释变量变异的能力,但还可以进一步改进。
    • R^{2}> 0.8:模型拟合较强,模型较好地解释了变量变异。
  • Adjusted \mathbf{R^{2}}在考虑解释变量数量的同时,对模型进行调整。增加不相关的变量会导致 Adjusted \mathbf{R^{2}}降低,防止过拟合
  • 8
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值