机器学习线性回归_机器学习中的简单线性回归步骤

简单线性回归,这是一种基于自变量值(X)来预测因变量值(Y)的方法。假设这两个变量是线性相关的。因此,我们尝试寻找一种根据特征或自变量(x)的线性函数来精确预测响应值(y)。

步骤1:数据预处理

更多说明可以去这篇文章看看:机器学习中的数据预处理步骤

我们将按照之前的数据预处理信息图表那样来执行相同的步骤:

导入相关库:

其中第三相关库matplotlib是用来可视化数据的。

6fe155dac7c0aae9550462cbab6c2e80.png

导入数据集:

17b540cff84379f2cff14b7d193bb011.png

检查缺失数据:

ceb97a20c81e9d2f993bda63b26dbf0c.png

从上面检查来看,未发现缺失值,所以这里不用做缺失值处理操作。

划分数据集:

f18839f7e676530dbfa87aa15be1de9c.png

特征缩放:

由于这里的数据相对较均匀,差距落差没那么大,所以这里不需要对其进行数据缩放。

步骤2:通过训练集来训练简单线性回归模型

为了使用模型来训练数据集,我们将使用来自 sklearn.linear_model 库的 LinearRegression类,然后我们创建一个 LinearRegression 类的 regressor 对象最后我们将使用LinearRegression 类的 fit() 方法将 regressor 对象对数据集进行训练。

f313df268f6416ab380e0b63174d3e2c.png

步骤3:预测结果

现在我们将预测来自测试集的观察结果。我们将把预测结果输出保存在向量 Y_pred 中。我们使用前一步中训练的回归模型 regressor 的 LinearRegression 类的预测方法来对结果进行预测。

551def2105f29369c2cd3b6f68162a90.png

步骤4:结果可视化

最后一步是将结果可视化,我们将使用matplotlib.pyplot库对我们的训练集结果和测试集结果做散点图,以查看我们的模型预测效果。

训练集结果可视化:

d2215056f53bb9b873da292a30306b71.png

测试集结果可视化:

b017abbcbe95fd04f2ec720255c890d6.png
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值