集成学习笔记2--回归模型

2.掌握基本的回归模型


使用sklearn构建完整的机器学习项目流程:

  1. 明确项目任务:回归/分类
  2. 收集数据集并选择合适的特征
  3. 选择度量模型性能的指标
  4. 选择具体的模型进行训练
  5. 评估模型性能并调参

2.1 使用sklearn构建完整的回归项目

  1. 收集数据集并选择合适的特征
    根据导论选择Boston数据集。

  2. 选择度量模型性能的指标
    https://scikit-learn.org/stable/modules/model_evaluation.html#regression-metrics
    在这个案例中,我们使用MSE均方误差为模型的性能度量指标。

    1. 均方误差MSE
      M S E = 1 n ∑ i = 0 n ( y i − y i ^ ) 2 MSE=\frac{1}{n}\sum_{i=0}^n(y_i-\hat{y_i})^2 MSE=n1i=0n(yiyi^)2
      MSE是预测值与观测值的误差平方和的均值。MSE越小,说明预测模型描述实验数据具有更好的精度。
    2. 平均绝对误差MAE
      M A E = 1 n ∑ i = 0 n ∣ y i − y i ^ ∣ MAE=\frac{1}{n}\sum_{i=0}^n|y_i-\hat{y_i}| MAE=n1i=0nyiyi^
      MAE是预测值与观测值的误差绝对值的均值。
    3. 决定系数 R 2 R^2 R2
      在这里插入图片描述

    R 2 = 1 − v a r ( y − y ^ ) v a r ( y − y ‾ ) = 1 − ∑ i = 0 n ( y i − y ^ ) 2 ∑ i = 0 n ( y i − y ‾ ) 2 R^2=1-\frac{var(y-\hat{y})}{var(y-\overline{y})} =1-\frac{\sum_{i=0}^n(y_i-\hat{y})^2}{\sum_{i=0}^n(y_i-\overline{y})^2} R2=1var(yy)var(yy^)=1i=0n(yiy)2i=0n(yiy^)2
    决定系数,也叫拟合优度。决定系数反应了y的波动有多少百分比能被x的波动所描述,即表征依变数Y的变异中有多少百分比,可由控制的自变数X来解释。越大表示拟合优度越好。

    1. 解释方差得分
      e x p l a i n e d − v a r i a n c e = 1 − v a r ( y − y ^ ) v a r ( y ) explained-variance=1-\frac{var(y-\hat{y})}{var(y)} explainedvariance=1
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值