定义:线性回归通过一个或者多个自变量与因变量之间之间进行建模的回归分析。其中特点为一个或多个称为回归系数的模型参数的线性组合
比如y=kx+b模型 已知x求k和b的值 然后再根据x值求y的值。
案例:这里有2010–2019年的房价的数据。这数据年度数据叫做x,然后求2020年的房价 这时候你已经知道了k和b,然后把x带入公式之中就可以求2020年的了,这就是预测。
求解K值的方法:
(1)正规方程求解
(2)梯度下降方法
(3)岭回归方法
案例一:正规方程
from sklearn.datasets import load_boston#导入数据源
from sklearn.linear_model import LinearRegression,SGDRegressor,Ridge#获取回归系数,正规方程求解方法,梯度下降方法,岭回归
from sklearn.model_selection import train_test_split#分割数据集
from sklearn.preprocessing import StandardScaler#标准化处理
from sklearn.metrics import mean_absolute_error#均方误差
lb=load_boston()#获取数据
#x_train,x_test为自变量也就是特征值 y_train,y_test是因变量也就是目标值
x_train,x_test,y_train,y_test=train_test_split(lb.data,lb.target,test_size=0.25)
#特征值进行标准化处理
std_x=StandardScaler()
x_train=std_x.fit_transform(x_train)
x_test=std_x.fit_transform(x_test)
#将数据集进行维度处理 变成二维数组
y_train=y_train.reshape(-1, 1)
y_test=y_test.reshape(-1,1)