岭回归和lasso回归

最新推荐文章于 2022-08-10 01:10:38 发布

hal3515

最新推荐文章于 2022-08-10 01:10:38 发布

阅读量507

点赞数

分类专栏：数学建模文章标签：数学建模美国大学生数学建模竞赛机器学习人工智能

本文链接：https://blog.csdn.net/weixin_44618906/article/details/104239592

版权

26 篇文章 50 订阅

订阅专栏

岭回归和lasso回归
在 OLS 回归模型的损失函数上加入了不同的惩罚项，本质就是正则化。

(1) 古典回归模型

矩阵表示 $\boldsymbol{y}=X\boldsymbol{\beta}+\boldsymbol{\epsilon}$
其中 $\boldsymbol{y}=(y_1,y_2,\dots,y_n)^T$ ， $\boldsymbol{\beta}=(\beta_1,\beta_2,\dots,\beta_n)^T$ ， $\boldsymbol{\epsilon}=(\epsilon_1,\epsilon_2,\dots,\epsilon_n)^T$ ，
$X=\left[ \begin{matrix} x_{11}&x_{12}&\dotsb&x_{1p}\\ x_{21}&x_{22}&\dotsb&x_{2p}\\ \vdots&\vdots&\ddots&\vdots\\ x_{n1}&x_{n2}&\dotsb&x_{np}\\ \end{matrix} \right]$

保证估计出来的回归系数无偏且一致

$E(\epsilon_i|X)=0~~(i=1,2,\dots,n)$
由上式得出的结论：

$E(\epsilon_i)=0$ 　　迭代期望定理： $E(E(\epsilon_i|X))=E(\epsilon_i)$
$Cov(\epsilon_i,x_{jk})=0~~(i=1,2,\dots,n,j=1,2,\dots,n,k=1,2,\dots,p)$ 即所有的自变量都与扰动项不相关。
$\begin{aligned} E(\epsilon_i|x_{jk})&=E[E(\epsilon_i|X)|x_{jk}]=0\\ E(x_{jk}\epsilon_i)&=E[E(x_{jk}\epsilon_i|x_{jk})]=E[x_{jk}E(\epsilon_i|x_{jk})]=0~~ (条件期望的线性性质为E[f(\boldsymbol{x}) y|\boldsymbol{x}]=f(\boldsymbol{x})E(y|\boldsymbol{x}))\\ Cov(\epsilon_i,x_{jk})&=E(\epsilon_ix_{jk})-E(\epsilon_i)E(x_{jk})\\ &=E(\epsilon_ix_{jk})\\ &=0 \end{aligned}$

保证能估计出来

$\boldsymbol{\hat{\beta}}=(\hat{\beta}_1,\hat{\beta}_2,\dots,\hat{\beta}_n)^T$

多元性线性回归： $\boldsymbol{\hat{\beta}}=\argmin_{\boldsymbol{\hat{\beta}}}\sum_{i=1}^n(y_i-x_i^T\boldsymbol{\hat{\beta}})^2$

岭回归： $\begin{aligned} \boldsymbol{\hat{\beta}}&=\argmin_{\boldsymbol{\hat{\beta}}}[\sum_{i=1}^n(y_i-x_i^T\boldsymbol{\hat{\beta}})^2+\lambda\sum_{k=1}^n\hat{\beta}_i^2]\\ &=\argmin_{\hat{\beta}}[(\boldsymbol{y}-X\boldsymbol{\hat{\beta}})^T(\boldsymbol{y}-X\boldsymbol{\hat{\beta}})+\lambda\boldsymbol{\hat{\beta}}^T\boldsymbol{\hat{\beta}}]\\ &=(X^TX+\lambda \boldsymbol{I})^{-1}X^T\boldsymbol{y} \end{aligned}$

⭐️确定 $\lambda$ 的方法

岭迹分析
当 $\lambda$ 取 $0\rightarrow \infin$ 时得到的 $\hat{\boldsymbol{\beta}}$ 中各个分量的变化曲线（岭迹图），将 $\lambda$ 选取在各回归系数相对稳定，符号合理，并且残差平方和增加不太多处，选取的主观成分比较多。

VIF 方法
已经知道当 $\max {\bf VIF_i } >10$ 存在严重的多重共线性，因此可以不断增加 $\lambda$ 最终保证所有的 $\hat{\beta}_i$ 的 VIF $< 10$ 。
K 折交叉验证 方法
将样本数据随机分为 $K$ 等分，依次选取子样本 $a_i$ 作为验证集，每次选取一个，并将剩下的 $K - 1$ 个子样本 $a_1,a_2,\dots,a_{i-1},a_{i+1},\dots,a_K$ 作为训练集来预测 $a_i$ ，并计算出 $\bf MSE_i$ ，最终求解 $\argmin_\lambda\sum_{i=1}^K{\bf MSE_i}$

Lasso 回归
$\boldsymbol{\hat{\beta}}=\argmin_{\boldsymbol{\hat{\beta}}}[\sum_{i=1}^n(y_i-x_i^T\boldsymbol{\hat{\beta}})^2+\lambda\sum_{k=1}^n|\hat{\beta}_i|]$
⭐️ 无显示解，只能使用近似估计算法，但相比于岭回归，好在可以将不需要的变量的回归系数直接压缩至 0。
STATA
- 下载对应的包findit lassopack
- cvlasso A1 A2...At,lopt seed(number)，number可以自己选择一个数填入，选取不同的数得到的结果不同。

关注