线性回归公式:
要拟合一个线性回归模型并且预测出新值的步骤:
>>> import numpy as np
>>> from sklearn.linear_model import LinearRegression
一、格式化数据
输入为n*d
的数组,其中n
表示数据的个数,d
是维度;输出值是一维数组。
#生成原始数据
>>> X = np.array([[1, 1], [1, 2], [2, 2], [2, 3]]) #变量X为输入变量
# dot()函数是矩阵相乘
>>> y = np.dot(X, np.array([1, 2])) + 3 #即y = 1 * x0 + 2 * x1 + 3(X中有4个元素x,x=[x0, x1],每个y对应1个x,所以y也有4个元素)
'''如果输出X、y,输出结果分别是
X:是列向量 => 下面的代码要执行的拟合操作的对象必须是列向量
array([[1, 1],
[1, 2],
[2, 2],
[2, 3]])
y:
array([ 6, 8, 9, 11])
'''
二、初始化模型LinearReregression()
调用LinearRegression类的方法fit(X,y),直接实例化了一个线性回归模型
>>> reg = LinearRegression()
三、拟合fit(X,y)
用上面生成的数据(指reg)进行拟合
>>> reg.fit(X, y) #fit()方法返回值是模型本身self
PS:二、三也可以合起来写成 reg = LinearRegression().fit(X, y)
四、预测predict(X_test)
利用拟合好的线性回归模型,来计算新输入值X对应的输出值y。(这里新输入值仍然和X输入的时候保持一致)
>>> reg.predict(np.array([[3, 5]])) #调用LinearRegression类的predict()方法
array([16.])
全过程代码
import numpy as np
from sklearn.linear_model import LinearRegression
X = np.array([[1, 1], [1, 2], [2, 2], [2, 3]])
y = np.dot(X, np.array([1, 2])) + 3
reg = LinearRegression()
reg.fit(X, y)
reg.predict(X)
array([ 6., 8., 9., 11.])
运行结果和理论值一致
详细过程代码
>>> import numpy as np
>>> from sklearn.linear_model import LinearRegression
#生成原始数据
>>> X = np.array([[1, 1], [1, 2], [2, 2], [2, 3]]) #变量X为输入变量
>>> y = np.dot(X, np.array([1, 2])) + 3 #即y = 1 * x0 + 2 * x1 + 3(X中有4个元素x,x=[x0, x1],每个y对应1个x,所以y也有4个元素)
'''如果输出X、y,输出结果分别是
X:是列向量 => 下面的代码要执行的拟合操作的对象必须是列向量
array([[1, 1],
[1, 2],
[2, 2],
[2, 3]])
y:
array([ 6, 8, 9, 11])
'''
>>> reg = LinearRegression().fit(X, y) #调用LinearRegression类的方法fit(X,y),直接实例化了一个线性回归模型,并且用上面生成的数据进行了拟合。
'''
也可以写成这样:
>>> reg = LinearRegression()
>>> reg.fit(X, y) #fit()方法返回值是模型本身self
'''
#系数和偏差值的展示
>>> reg.coef_ #系数值分别等于 1,2 对应 ’y = 1 * x0 + 2 * x1 + 3‘ 中的2个系数
array([1., 2.])
>>> reg.intercept_ #偏差值是3 对应 ’y = 1 * x0 + 2 * x1 + 3‘ 中的’3‘
3.0000...
#利用拟合好的线性回归模型,来计算新输入值X对应的输出值y。这里新输入值仍然和拟合时的格式保持一致(第五行)。
>>> reg.predict(np.array([[3, 5]])) #调用LinearRegression类的predict()方法
array([16.])