sklearn快速入门教程：线性回归学习笔记

Erick Yu

已于 2022-08-09 16:05:12 修改

阅读量288

点赞数

文章标签： sklearn 线性回归学习

于 2022-08-08 19:48:14 首次发布

本文链接：https://blog.csdn.net/ykrsgs/article/details/126232167

版权

线性回归公式：

要拟合一个线性回归模型并且预测出新值的步骤：

>>> import numpy as np
>>> from sklearn.linear_model import LinearRegression

一、格式化数据

输入为n*d的数组，其中n表示数据的个数，d是维度；输出值是一维数组。

#生成原始数据
>>> X = np.array([[1, 1], [1, 2], [2, 2], [2, 3]]) #变量X为输入变量
# dot()函数是矩阵相乘
>>> y = np.dot(X, np.array([1, 2])) + 3 #即y = 1 * x0 + 2 * x1 + 3（X中有4个元素x，x=[x0, x1]，每个y对应1个x，所以y也有4个元素）
'''如果输出X、y，输出结果分别是
X：是列向量 => 下面的代码要执行的拟合操作的对象必须是列向量
array([[1, 1],
       [1, 2],
       [2, 2],
       [2, 3]])

y: 
array([ 6,  8,  9, 11])
'''

二、初始化模型`LinearReregression()`

调用LinearRegression类的方法fit(X,y)，直接实例化了一个线性回归模型

>>> reg = LinearRegression()

三、拟合`fit(X,y)`

用上面生成的数据（指reg）进行拟合

>>> reg.fit(X, y) #fit()方法返回值是模型本身self

PS：二、三也可以合起来写成 reg = LinearRegression().fit(X, y)

四、预测`predict(X_test)`

利用拟合好的线性回归模型，来计算新输入值X对应的输出值y。（这里新输入值仍然和X输入的时候保持一致）

>>> reg.predict(np.array([[3, 5]])) #调用LinearRegression类的predict()方法
array([16.])

全过程代码

import numpy as np
from sklearn.linear_model import LinearRegression
X = np.array([[1, 1], [1, 2], [2, 2], [2, 3]])
y = np.dot(X, np.array([1, 2])) + 3

reg = LinearRegression()
reg.fit(X, y)


reg.predict(X)

array([ 6.,  8.,  9., 11.])

运行结果和理论值一致

详细过程代码

>>> import numpy as np
>>> from sklearn.linear_model import LinearRegression

#生成原始数据
>>> X = np.array([[1, 1], [1, 2], [2, 2], [2, 3]]) #变量X为输入变量
>>> y = np.dot(X, np.array([1, 2])) + 3 #即y = 1 * x0 + 2 * x1 + 3（X中有4个元素x，x=[x0, x1]，每个y对应1个x，所以y也有4个元素）
'''如果输出X、y，输出结果分别是
X：是列向量 => 下面的代码要执行的拟合操作的对象必须是列向量
array([[1, 1],
       [1, 2],
       [2, 2],
       [2, 3]])

y: 
array([ 6,  8,  9, 11])
'''
>>> reg = LinearRegression().fit(X, y) #调用LinearRegression类的方法fit(X,y)，直接实例化了一个线性回归模型，并且用上面生成的数据进行了拟合。
'''
也可以写成这样：
>>> reg = LinearRegression()
>>> reg.fit(X, y) #fit()方法返回值是模型本身self
'''

#系数和偏差值的展示
>>> reg.coef_ #系数值分别等于 1,2 对应 ’y = 1 * x0 + 2 * x1 + 3‘ 中的2个系数
array([1., 2.])
>>> reg.intercept_ #偏差值是3 对应 ’y = 1 * x0 + 2 * x1 + 3‘ 中的’3‘
3.0000...

#利用拟合好的线性回归模型，来计算新输入值X对应的输出值y。这里新输入值仍然和拟合时的格式保持一致（第五行）。
>>> reg.predict(np.array([[3, 5]])) #调用LinearRegression类的predict()方法
array([16.])