岭回归和Lasso 回归

最新推荐文章于 2024-06-21 13:14:34 发布

IMWTJ

最新推荐文章于 2024-06-21 13:14:34 发布

阅读量1.9k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/IMWTJ123/article/details/88742238

版权

线性回归存在问题：

在处理复杂的回归问题时，普通的线性回归问题会出现预测精度不够的问题，如果模型中特征之间有较强的相关关系时，即特征之间出现严重的多重共线性时，用普通最小二乘法估计模型参数，往往参数估计的方差太大，求出来的模型就很不稳定。再具体取值上与真值有较大偏差。这时就需要对数据中的特征进行提取，回归算法里面的特征选择的方法有岭回归和 Lasso 回归。这两种方法都属于正则化的特征选择方法，在处理复杂的数据回归问题中常用。

一、岭回归Rdige Regression模型

岭回归在平均误差的基础上增加正则项：

$l=\sum_{i=1}^{m}(y^{(i)}-\sum_{j=0}^{n}w_{j}x_{j}^{(i)})^{2}+\lambda \sum_{j=0}^{n}w_{j}^{2}$

其中， $\lambda > 0$ ，通过确定 $\lambda$ 的值可以使得在方差和偏差之间达到平衡：随着 $\lambda$ 的增大，模型方差减少而偏差增大。

岭回归模型的求解：

利用最小二乘法求解岭回归模型的参数，对W求导并令其为零。

$2X^{T}\left ( Y-XW \right )-2\lambda W\Rightarrow \hat{W}=\left ( X^{T} X+\lambda I\right )^{-1}X^{T}Y$

二、Lasso 回归模型

Lasso 采用的则是 L1正则，即 Lasso是在平方误差的基础上增加 L1 正则：

$l=\sum_{i=1}^{m}(y^{(i)}-\sum_{j=0}^{n}w_{j}x_{j}^{(i)})^{2}+\lambda \sum_{j=0}^{n}\left | w_{j} \right |$

与基于 L2 回归的岭回归不同的是，上述的损失函数在 $w_{j}=0$ 处不可导，因此传统的基于梯度的方法不能直接用来求解损失函数。问了解决这个问题，采用近似的优化算法，或者采用一些简单的方法来近似这样的优化算法。

三、拟牛顿法

BFGS 算法是使用较多的一种拟牛顿方法，是由 Broyde、Fletcher、Goidfarb和Shanno 四人提出，所以称为 BFGS。（莫名想到TFBOYS，哈哈哈哈哈）

对于拟牛顿方程：

$\bigtriangledown f\left ( x_{k} \right )=\bigtriangledown f\left ( x_{k+1} \right )+G_{k+1}(x_{k}-x_{k+1})$

令 $B_{k+1}\doteq G_{k+1}$ ，则可得：

最低0.47元/天解锁文章

IMWTJ

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
岭回归和Lasso 回归

线性回归存在问题：在处理复杂的回归问题时，普通的线性回归问题会出现预测精度不够的问题，如果模型中特征之间有较强的相关关系时，即特征之间出现严重的多重共线性时，用普通最小二乘法估计模型参数，往往参数估计的方差太大，求出来的模型就很不稳定。再具体取值上与真值有较大偏差。这时就需要对数据中的特征进行提取，回归算法里面的特征选择的方法有岭回归和 Lasso 回归。这两种方法都属于正则化的特征选...
复制链接

扫一扫

专栏目录