1.线性回归原理
1.1简单线性回归
当一个变量会随着另一个变量的变化而变化,比如随着工作年数的增长,你的工资的变化情况,这之间就存在一种近似的线性关系。
简单的线性回归模型如下:
y = θ x + b y=θx+b y=θx+b
其中x表示特征值(如工作年份),θ表示权重,b表示为偏置量,y表示标签(如工资)
上述的模型也可以看做是有两个特征值的模型,其中 x 0 x_0 x0始终为1,如下所示,
θ = ( θ 0 , θ 1 ) θ=(θ_0,θ_1) θ=(θ0,θ1)
X = ( x 0 x 1 ) X=\begin{pmatrix}x_0\\x_1\end{pmatrix} X=(x0x1)
则上述回归模型可以写成
y = θ X = θ 0 x 0 + θ 1 x 1 y=θX = θ_0x_0+θ_1x_1 y=θX=θ0x0+θ1x1
1.2多元线性回归
当一个变量会随着多个变量的变化而变化,如房子的价格会因为房子的面积、房子的房间数等因素而影响,如果要给他们之间建立相应的关系,则需要使用多元线性回归。
多元线性回归模型如下:
θ = ( θ 0 , θ 1 . . . . θ n ) θ=(θ_0,θ_1....θ_n) θ=(θ0,θ1....θn)
X = ( x 0 x 1 . . . x n ) X=\begin{pmatrix}x_0\\x_1\\.\\.\\.\\x_n\end{pmatrix} X=⎝⎜⎜⎜⎜⎜⎜⎛x0x1...xn⎠⎟⎟⎟⎟⎟⎟⎞
y = θ X = θ 0 x 0 + θ 1 x 1 + θ 2 x 2 + . . . + θ n x n y=θX =\theta_0x_0+\theta_1x_1+\theta_2x_2+...+\theta_nx_n y=θX=θ0x