线性回归岭回归 lasso 详细介绍

最新推荐文章于 2025-01-14 17:19:02 发布

Lem3101

最新推荐文章于 2025-01-14 17:19:02 发布

阅读量648

点赞数

分类专栏：优化算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_20186593/article/details/80287438

版权

本文详细介绍了线性回归的几种形式，包括最小二乘模型、子空间约束最小二乘（岭回归）和l1约束最小二乘（Lasso）。重点讨论了岭回归和Lasso的模型、算法，如坐标下降法、二次规划和投影随机梯度下降，并解释了它们在处理高维数据和特征选择上的优势。

摘要由CSDN通过智能技术生成

线性回归

已知 $n$ 个样本 $\{(x_i,y_i)\}^n_{i=1}$ ，其中 $x_i\in \mathbb{R}^d,y_i\in \mathbb{R}$

回归问题学习实值函数 $y=f(x)$ ，其中 $f:\mathbb{R}^d\to \mathbb{R}$

最小二乘模型(Least Squares Regression)

模型

最小二乘模型的优化问题为：

θ^L S = argmin θ J L S (θ) (1)

$\hat{\theta}_{LS}=\mathop{\text{argmin}}\limits_{\theta} J_{LS}(\theta) \tag{1}$
其中

J L S (θ) = 1 2 \sum i = 1 n (y i - f θ (x i)) 2 f θ (x) = \sum i = 1 b θ i ϕ i (x) = θ T ϕ (x)

$J_{LS}(\theta)=\frac{1}{2}\sum_{i=1}^{n}(y_i-f_{\theta}(x_i))^2\\ f_{\theta}(x)=\sum_{i=1}^{b}\theta_i\phi_i(x)=\theta^T\phi(x)$

ϕ:Rd→Rb ϕ : R d → R b $\phi:\mathbb{R}^d\to\mathbb{R}^b$ 为一个映射，可以是非线性，如

ϕ(x)=xTx ϕ ( x ) = x T x $\phi(x)=x^Tx$

用向量和矩阵可表示为：

J L S (θ) = 1 2 | | y - Φ θ | | 22

$J_{LS}(\theta)=\frac{1}{2}||y-\Phi\theta||^2_2$
其中

y = (y 1, \dots, y n) T Φ = ⎡ ⎣ ⎢ ⎢ ϕ 1 (x 1) ⋮ ϕ 1 (x n) \dots \dots ϕ b (x 1) ⋮ ϕ b (x n) ⎤ ⎦ ⎥ ⎥

$y=(y_1,\dots,y_n)^T \\ \Phi=\left[ \begin{array}{ccc} \phi_1(x_1) & \cdots & \phi_b(x_1)\\ \vdots & & \vdots\\ \phi_1(x_n) & \cdots & \phi_b(x_n) \end{array} \right ]$

Φ∈Rn×b Φ ∈ R n × b $\Phi\in\mathbb{R}^{n\times b}$ 为设计矩阵(design matrix)

由于 $J_{LS}(\theta)$ 为凸函数，优化问题(1)有最优解，且最优值点满足：

\nabla θ J L S = - Φ T (y - Φ θ) = 0

$\nabla_{\theta}J_{LS}=-\Phi^T(y-\Phi\theta)=0$
求解线性方程可得：

θ^L S = (Φ T Φ) + Φ y

$\hat{\theta}_{LS}=(\Phi^T\Phi)^+\Phi y$
其中

(ΦTΦ)+ ( Φ T Φ ) + $(\Phi^T\Phi)^+$ 表示

ΦTΦ Φ T Φ $\Phi^T\Phi$ 的广义逆，当

Φ Φ $\Phi$ 列满秩时，

ΦTΦ Φ T Φ $\Phi^T\Phi$ 为满秩矩阵，即

(ΦTΦ)+=(ΦTΦ)−1 ( Φ T Φ ) + = ( Φ T Φ ) − 1 $(\Phi^T\Phi)^+=(\Phi^T\Phi)^{-1}$ ，此时

θ^L S = (Φ T Φ) - 1 Φ y

$\hat{\theta}_{LS}=(\Phi^T\Phi)^{-1}\Phi y$

算法

利用公式 $\hat{\theta}_{LS}=(\Phi^T\Phi)^+\Phi y$ 计算
梯度下降(收敛)：

迭代公式为 $\theta \longleftarrow \theta-\epsilon \nabla_{\theta}J_{LS}$ ，其中 $\nabla_{\theta}J_{LS}=-\Phi^T(y-\Phi\theta)$

拓展

加权最小二乘(Weighted LS)：

argmin θ 1 2 \sum i = 1 n w i (y i - f θ (x i)) 2

$\mathop{\text{argmin}}\limits_{\theta} \frac{1}{2}\sum_{i=1}^{n}w_i(y_i-f_{\theta}(x_i))^2$
其中

wi∈R+,i=1,…,n w i ∈ R + , i = 1 , … , n $w_i\in\mathbb{R}^+,i=1,\dots,n$ 为权重

用向量矩阵表示为：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。