正规方程(normal equation)-CSDN博客

本文链接：https://blog.csdn.net/qq_39875876/article/details/106318441

本文介绍了线性回归模型中正规方程的原理和推导过程，包括损失函数、导数求解及矩阵形式表达。当XTX可逆时，最优参数W=(XTX)^{-1}XTY；若不可逆，则引入正则化项，W=(XTX+lambda I)^{-1}XTY。正规方程与梯度下降法进行了比较。

摘要由CSDN通过智能技术生成

正规方程(normal equation)

线性回归模型求拟合函数的最优参数，一般有两种方法：

梯度下降法，过程是对损失函数的每个参数求偏导，通过迭代一步步更新，直至收敛到局部或全局最小值，从而得到最优参数。
正规方程，过程是对于一个损失函数，将其对参数求导，得到导函数并将其值置为0，从而解出最优参数。

下面是正规方程的推导：

线性回归模型：
$f(x)=w_0 + w_1x_1+w_2x_2+\dots+w_dx_d\\$
即：
$f(x)=w_0x_0 + w_1x_1+w_2x_2+\dots+w_dx_d\\ Note:\ \ \ x_0 = 1$
写成向量形式：
$f(x^i)=W^Tx^i\\ Note: x^i表示第i个样本$
其中：
$\begin{array}{l} \begin{array}{lcr} X= \begin{bmatrix} x^1_0 & x^1_1 & \dots & x^1_d\\ x^2_0 & x^2_1 & \dots & x^2_d\\ x^3_0 & x^3_1 & \dots & x^3_d\\ \vdots & \vdots & \vdots & \vdots\\ x^m_0 & x^m_1 & \dots & x^m_d \end{bmatrix} & W=\begin{bmatrix} w_0\\w_1\\w_2\\\vdots\\w_d \end{bmatrix} & Y=\begin{bmatrix} y_1\\y_2\\y_3\\\vdots\\y_m \end{bmatrix} \end{array}\\ Note:\ d为特征个数，m为样本个数，x^i_0 = 1 \end{array}$