回归 - 最小二乘，岭回归，lasso

最新推荐文章于 2024-04-18 15:38:53 发布

不甘心的程序员

最新推荐文章于 2024-04-18 15:38:53 发布

阅读量1.8k

点赞数 1

分类专栏：笔记文章标签： linear regression

笔记专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1. 岭回归

岭回归，又称脊回归、吉洪诺夫正则化（Tikhonov regularization），是对不适定问题（ill-posed problem)进行回归分析时最经常使用的一种正则化方法

适定问题是指定解满足下面三个要求的问题：① 解是存在的；② 解是唯一的；③ 解连续依赖于定解条件，即解是稳定的。这三个要求中，只要有一个不满足，则称之为不适定问题。

岭回归是对最小二乘估计的一个补充，最小二乘估计法是无偏估计，而岭回归放弃了无偏估计，以损失部分信息，降低精度为代价来更好的拟合数据，常用在“病态数据”。比如，对于有些矩阵，矩阵中某个元素的一个很小的变动，会引起最后计算结果误差很大，这种矩阵称为“病态矩阵”
对于一个适定问题， $X$ 通常是列满秩的，采用最小二乘法，（通常样本数量n要大于特征数量p，才有唯一解）我们最后可以得到求解公式最小二乘法求解其中， $X$ 通常是列满秩的

当 $X$ 不是列满秩的时候，或者某些列之间的线性相关比较大时， $X^TX$ 的行列式接近于0，即 $X^TX$ 接近于奇异，上述问题变为一个不适定问题，此时，计算 $(X^TX)^{-1}$ 时误差会很大，传统的最小二乘法缺乏稳定性与可靠性。
转化为适定问题：为损失函数加上一个正则项，得岭回归的损失函数为 $L =\frac 1 2 \Vert X \theta - y\Vert^2 + \frac 1 2 \Vert \Gamma \theta \Vert ^2$ 对 $\theta$ 求导，定义 $\Gamma = \alpha I$ , 可得 $\theta(\alpha) = (X^TX + \alpha I)^{-1}X^Ty$ ，其中 $I$ 是单位矩阵， $\Vert \Gamma \theta \Vert ^2$ 可以看作是特征的方差，即各个特征的权的总的平衡程度

随着 $\alpha$ 的增大， $\theta(\alpha)$ 各元素 $\theta(\alpha)_i$ 的绝对值均趋于不断变小，它们相对于正确值 $\theta_i$ 的偏差也越来越大。 $\alpha$ 趋于无穷大时， $\theta(\alpha)$ 趋于0。其中， $\theta(\alpha)$ 随 $\alpha$ 的改变而变化的轨迹，就称为岭迹。实际计算中可选非常多的 $\alpha$ 值，做出一个岭迹图，看看这个图在取哪个值的时候变稳定了，那就确定 $\alpha$ 值了。

详细的图示见参考链接

refer：
岭回归与最小二乘估计的区别
 岭回归-简书

2. lasso

损失函数为 $L =\frac 1 2 \Vert X \theta - y\Vert^2 + \lambda \sum_{i=0}^n \vert w_i \vert$
与岭回归的区别就在于正则项不同，lasso更容易产生解为0的情况，可以起到筛选变量的目的

refer：
岭回归，lasso 回归

3. 偏差和方差

偏差bais：误差，数据的准确性，分为系统误差和随机误差(只能尽量减少，不能避免)，在线性回归中常用b来表示，
方差 variance：预测出来的数据的分散程度
残差：观测值与真实值之间的差距，衡量的是预测的准确性。与数据本身的分布特性以及回归方程的选择有关。 $y - \hat y$
残差平方和： residual sum of squares $W\Vert Y - \hat Y \Vert ^2$

refer: 残差方差离差

不甘心的程序员

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
回归 - 最小二乘，岭回归，lasso

1. 岭回归2. lasso3. 偏差和方差1. 岭回归岭回归，又称脊回归、吉洪诺夫正则化（Tikhonov regularization），是对不适定问题（ill-posed problem)进行回归分析时最经常使用的一种正则化方法适定问题是指定解满足下面三个要求的问题：① 解是存在的；② 解是唯一的；③ 解连续依赖于定解条件，即解是稳定的...
复制链接

扫一扫

专栏目录