岭回归与最小二乘法

最新推荐文章于 2024-04-06 15:13:55 发布

回想sy

最新推荐文章于 2024-04-06 15:13:55 发布

阅读量475

点赞数 1

分类专栏：机器学习文章标签：概率论机器学习线性代数

本文链接：https://blog.csdn.net/weixin_49708196/article/details/120105526

版权

机器学习专栏收录该内容

13 篇文章 1 订阅

订阅专栏

本文详细探讨了岭回归作为最小二乘法的正则化形式，解释了如何通过增加拉格朗日乘子λ来解决过拟合问题。通过数学推导展示了岭回归的解法，并从最大后验概率的角度阐述了最小二乘法的岭回归形式，指出该方法通过对权重矩阵施加高斯分布假设来实现权重衰减。

摘要由CSDN通过智能技术生成

#! https://zhuanlan.zhihu.com/p/406879862

岭回归与最小二乘法

对于过拟合我们有很多种处理方法，常用的有三种：增加数据、特征选择、正则化。岭回归即我们通常所述的 $l 2$ 正则,这里研究一下上一篇文章的最小二乘法的岭回归的形式。
首先回顾一下最小二乘法， $L=\sum_{i=1}^{N}\|w^Tx_i-y_i\|^2$ ,得到 $\hat{w}=\underset{w}{argmin}L=(X^TX)^{-1}X^TY$
对于岭回归的最小二乘法,
$\begin{aligned} L&=\sum_{i=1}^{N}\|w^Tx_i-y_i\|^2 + \lambda w^Tw\\ &=\begin{pmatrix}w^Tx_1-y_1 & w^Tx_2-y_2 & \cdots & w^Tx_N-y_N\end{pmatrix}\begin{pmatrix} w^Tx_1-y_1 \\ w^Tx_2-y_2 \\ \vdots \\ w^Tx_N-y_N \end{pmatrix} + \lambda w^Tw \\ &=(w^TX^T-Y^T)(Xw-Y) + \lambda w^Tw \\ &=w^T(X^TX+\lambda I)w - 2w^TX^TY+Y^TY \end{aligned}$
$\begin{aligned} \frac{\partial L}{\partial w} = 2(X^TX+\lambda I)w - 2X^TY=0 \end{aligned}$
所以 $(X^TX+\lambda I)X^TY$ 。

另一个角度看 $l 2$ 正则化的最小二乘法

对于最小二乘法中的权重 $w$ 假设 $w\sim N(0, \sigma^2_0)$ 。从最大后验角度出发。但是仍有我的上一章的一些结论，文章传送：https://blog.csdn.net/weixin_49708196/article/details/120034186?spm=1001.2014.3001.5501，有结论从极大似然的角度来看最小二乘法是相当于用极大似然估计求噪声为高斯分布的的线性模型，即 $\sim N(0, \sigma^2)$
$\begin{aligned} \hat{w} &= \underset{w}{argmax}\prod_{i=1} p(w|y_i) \\ &= \underset{w}{argmax} \prod_{i=1}\frac{p(y_i|w)p(w)}{p(y_i)} \\ &= \underset{w}{argmax}\prod_{i=1}p(y_i|w)p(w) \\ &= \underset{w}{argmax}\sum_{i=1}\log (p(y_i|w)) + \log (p(w)) \\ &= \underset{w}{argmax} \sum_{i=1} \log (\frac{1}{\sqrt{2\pi}\sigma}e^{\frac{\|y_i-w^Tx_i\|^2}{2\sigma ^ 2}}) + \log (\frac{1}{\sqrt{2\pi }\sigma_{0}}e^{\frac{\|w\|^2}{2\sigma ^2_0}}) \\ &= \underset{w}{argmin}\sum_{i=1}\log (\sqrt{2\pi }\sigma ) + \|y_i-w^Tx_i\|^2 + \log(\sqrt{2\pi }\sigma_0) + \|w\|^2 \\ &= \underset{w}{argmin} \sum_{i=1}\frac{\|y_i-w^Tx_i\|^2}{\sigma ^ 2} + \frac{\|w\|^2}{\sigma^2_0} \\ &= \underset{w}{argmin} \sum_{i=1} \|y_i-w^Tx_i\|^2 + \frac{\sigma^2}{\sigma^2_0} \|w\|^2 \end{aligned}$

可以看出上式便是最小二乘法的岭回归，所以我们边可以得到结论最小二乘法的岭回归即是对权重矩阵 $w$ 做了一个假设，假设其服从高斯分布，以此达到衰减权重的目的。

回想sy

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
岭回归与最小二乘法

#! https://zhuanlan.zhihu.com/p/406879862岭回归与最小二乘法对于过拟合我们有很多种处理方法，常用的有三种：增加数据、特征选择、正则化。岭回归即我们通常所述的 l2l2l2 正则,这里研究一下上一篇文章的最小二乘法的岭回归的形式。首先回顾一下最小二乘法，L=∑i=1N∥wTxi−yi∥2L=\sum_{i=1}^{N}\|w^Tx_i-y_i\|^2L=∑i=1N∥wTxi−yi∥2,得到w^=argminwL=(XTX)−1XTY\hat{w}=\und
复制链接

扫一扫