python回归模型_Python 构建并评价回归模型_Python sklearn - 树懒学堂

本文介绍了回归算法的实现过程,类似于分类算法,但其标签是连续的。线性回归模型在多个领域有广泛应用。通过sklearn构建了线性回归模型,并使用boston数据集进行示例。模型评估指标如平均绝对误差、均方误差等用于衡量模型性能,目标是使这些值更接近于0。线性回归模型仍有改进空间。
摘要由CSDN通过智能技术生成

构建并评价回归模型

回归算法的实现过程与分类算法类似,原理相差不大。分类和回归的主要区别在于,分类算法的标签是离散的,但是回归算法的标签是连续的。回归算法在交通、物流、社交网络和金融领域都能发挥巨大作用。

1、使用sklearn估计器构建线性回归模型

从19世纪初高斯提出最小二乘估计法算起,回归分析的历史已有200多年。从经典的回归分析方法到近代的回归分析方法,按照研究方法划分,回归分析研究的范围大致如下图所示。

image-171.png

在回归模型中,自变量与因变量具有相关关系,自变量的值是已知的,因变量是要预测的。回归算法的实现步骤和分类算法基本相同,分为学习和预测两个步骤。学习是通过训练样本数据来拟合回归方程的;预测则是利用学习过程中拟合出的回归方程,将测试数据放入方程中求出预测值。常用的回归模型如下表所示。

image-172.png

Sklearn库内部有不少回归算法,常用的如下表所示。

image-173.png

以boston数据集为例,使用sklearn估计器构建线性回归模型。

image-174.png

利用预测结果和真实结果画出折线图,能较为直观地看出线性回归模型效果。

image-175.png

2、评价回归模型

回归模型的性能评价不同于分类模型,虽然都是对照真实值进行评价,但由于回归模型的预测结果和真实值都是连续的,所以不能够求取Precision、Recall和F1值等评价指标。回归模型拥有一套独立的评价指标。

常用的回归模型评价指标如下表所示。

image-176.png

平均绝对误差、均方误差和中值绝对误差的值越靠近 0,模型性能越好。可解释方差值和R2值越靠近1,模型性能越好。

image-177.png

建立的线性回归模型拟合效果一般,还有较大的改进余地。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值