正规方程(normal equation)
线性回归模型求拟合函数的最优参数,一般有两种方法:
- 梯度下降法,过程是对损失函数的每个参数求偏导,通过迭代一步步更新,直至收敛到局部或全局最小值,从而得到最优参数。
- 正规方程,过程是对于一个损失函数,将其对参数求导,得到导函数并将其值置为0,从而解出最优参数。
下面是正规方程的推导:
线性回归模型:
f ( x ) = w 0 + w 1 x 1 + w 2 x 2 + ⋯ + w d x d f(x)=w_0 + w_1x_1+w_2x_2+\dots+w_dx_d\\ f(x)=w0+w1x1+w2x2+⋯+wdxd
即:
f ( x ) = w 0 x 0 + w 1 x 1 + w 2 x 2 + ⋯ + w d x d N o t e : x 0 = 1 f(x)=w_0x_0 + w_1x_1+w_2x_2+\dots+w_dx_d\\ Note:\ \ \ x_0 = 1 f(x)=w0x0+w1x1+w2x2+⋯+wdxdNote: x0=1
写成向量形式:
f ( x i ) = W T x i N o t e : x i 表 示 第 i 个 样 本 f(x^i)=W^Tx^i\\ Note: x^i表示第i个样本 f(xi)=WTxiNote:xi表示第i个样本
其中:
X = [ x 0 1 x 1 1 … x d 1 x 0 2 x 1 2 … x d 2 x 0 3 x 1 3 … x d 3 ⋮ ⋮ ⋮ ⋮ x 0 m x 1 m … x d m ] W = [ w 0 w 1 w 2 ⋮ w d ] Y = [ y 1 y 2 y 3 ⋮ y m ] N o t e : d 为 特 征 个 数 , m 为 样 本 个 数 , x 0 i = 1 \begin{array}{l} \begin{array}{lcr} X= \begin{bmatrix} x^1_0 & x^1_1 & \dots & x^1_d\\ x^2_0 & x^2_1 & \dots & x^2_d\\ x^3_0 & x^3_1 & \dots & x^3_d\\ \vdots & \vdots & \vdots & \vdots\\ x^m_0 & x^m_1 & \dots & x^m_d \end{bmatrix} & W=\begin{bmatrix} w_0\\w_1\\w_2\\\vdots\\w_d \end{bmatrix} & Y=\begin{bmatrix} y_1\\y_2\\y_3\\\vdots\\y_m \end{bmatrix} \end{array}\\ Note:\ d为特征个数,m为样本个数,x^i_0 = 1 \end{array} X=⎣⎢⎢⎢⎢⎢⎡x01x02x03⋮x0mx11x12x13⋮x1m………⋮…xd1xd2xd3⋮xdm⎦⎥⎥⎥⎥⎥⎤W=⎣⎢⎢⎢⎢⎢⎡w0w1w2⋮wd⎦⎥⎥⎥⎥⎥⎤Y=⎣