Python机器学习之简单线性回归分析

简单线性回归

​ 这一节我们来介绍一下最广为人知的线性回归模型——将数据拟合成一条直线。直线方程为:y = ax + b,其中a是直线的斜率,b是直线的截距。

数据分析

首先导入常用的数据库:

%matplotlib inline
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
import numpy as np

接下来,我们将直线方程的斜率定为2,截距定为5来进行实验。

#np.random.RandomState()是伪随机数发生器,会产生一个随机状态的种子
#RandomState(1)是将种子设置为1,只要种子相同,产生的随机数序列就是相同的。
rng = np.random.RandomState(1)
#将随机数赋给rng
x = 10 * rng.rand(50)
#rand(50)返回50个一维数组,即50个随机数
y = 2 * x - 5 + rng.randn(50)
#randn函数返回50个随机数,且具有标准正态分布。
plt.scatter(x,y);
#生成一个散点图

线性回归数据图如下:

在这里插入图片描述

拟合数据

下一步我们用Scikit-Learn的LinearRegression评估器来拟合数据, 并获得最佳拟合直线。我们的操作步骤分为以下几步:

1.建立线性回归评估器
from sklearn.linear_model import LinearRegression
#线性回归,安装scikit-learn包
model = LinearRegression(fit_intercept=True)
#LinearRegression → 线性回归评估器,用于拟合数据得到拟合直线fit_intercept参数为True代表计算截距
2.拟合直线
model.fit(x[:, np.newaxis], y)
#model.fit(x,y) → 拟合直线,参数分别为x与y
#x[:,np.newaxis] → 将数组变成(n,1)形状
3.创建测试数据
xfit = np.linspace(0,10,1000)
# 这是将0到10内的数分成1000份
yfit = model.predict(xfit[:, np.newaxis])
# 创建测试数据xtest,并根据拟合曲线求出ytest
# model.predict → 预测
4.生成数据图
plt.scatter(x,y)
#生成一个散点图
plt.plot(xfit,yfit);
#生成直线

最终生成的线性回顾模型图如下:

在这里插入图片描述

  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值