最小二乘法

最新推荐文章于 2024-06-14 10:40:06 发布

guofei_fly

最新推荐文章于 2024-06-14 10:40:06 发布

阅读量949

点赞数

分类专栏：数学文章标签：最小二乘法

本文链接：https://blog.csdn.net/guofei_fly/article/details/103827311

版权

数学专栏收录该内容

14 篇文章 5 订阅

订阅专栏

最小二乘法是历史上非常有名的用于解决回归最值的方法，其可以理解为回归问题平方损失函数的解析解。

假设数据集为 $(\boldsymbol X,\boldsymbol y)$ ，线性模型系数为 $\boldsymbol W$ ，则对应的平方损失函数为： $L(\boldsymbol X,\boldsymbol y;\boldsymbol W) =(\boldsymbol y-\boldsymbol {XW})^T(\boldsymbol y-\boldsymbol {XW})$ 将上式对 $\boldsymbol W$ 求偏导，并另值为0，则： $\frac{\partial L}{\partial \boldsymbol W}=-\boldsymbol X^T(\boldsymbol y-\boldsymbol {XW})=0$ 可得： $\boldsymbol W=(\boldsymbol {X^TX})^{-1}\boldsymbol {X^Ty}$ 上式即为最小二乘法的矩阵计算公式。相较于梯度下降法、牛顿法等梯度下降方法，最小二乘法可以一次性求出线性模型的系数，但其缺点也非常明显：
（1）若数据规模大，则整个矩阵运算的存储量和计算量均很大；
（2）当数据特征间存在多重共线性时，数据协方差矩阵 $\boldsymbol {X^TX}$ 并不可逆，这会导致最小二乘法失效。

解决上述多重共线性问题的常见方法有三种：
（1）特征筛选或数据降维。基于统计学知识，对特征的相关性进行排查；或者直接采用PCA等降维算法生成独立的特征。
（2）向前逐步回归，可看做一种基于模型的向前特征选择。
（3）对线性模型进行改造，使其能够使用应对多重共线性的场合。

在上述第（3）种方案中，岭回归（Ridge Regression）通过引入L2惩罚项，实现对协方差矩阵的调整，尽量避免了其不可逆的问题。
此时，损失函数为 $L(\boldsymbol X,\boldsymbol y;\boldsymbol W) =(\boldsymbol y-\boldsymbol {XW})^T(\boldsymbol y-\boldsymbol {XW})+\alpha||\boldsymbol W||_2^2$ 式中 $\alpha$ 为惩罚因子，上式对 $\boldsymbol W$ 求偏导，可得： $\frac{\partial L}{\partial \boldsymbol W}=-\boldsymbol X^T(\boldsymbol y-\boldsymbol {XW})+2\alpha\boldsymbol W=0$ 从而，可得： $\boldsymbol W=(\boldsymbol {X^TX+2\alpha\boldsymbol I})^{-1}\boldsymbol {X^Ty}$ 上式中，逆矩阵内的项在决大多数情况下正定。即使存在行列式为0的情况，也可通过适当调整 $\alpha$ 值进行回避。

guofei_fly

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
最小二乘法

最小二乘法是历史上非常有名的用于解决回归最值的方法，其可以理解为回归问题平方损失函数的解析解。假设数据集为(X,y)(\boldsymbol X,\boldsymbol y)(X,y)，线性模型系数为W\boldsymbol WW，则对应的平方损失函数为：L(X,y;W)=(y−XW)T(y−XW)L(\boldsymbol X,\boldsymbol y;\boldsymbol W) =(...
复制链接

扫一扫

专栏目录