lasso的今世前身

最新推荐文章于 2024-07-29 20:45:31 发布

bxflyquan

最新推荐文章于 2024-07-29 20:45:31 发布

阅读量5.3k

点赞数 7

分类专栏：数据挖掘文章标签： lasso-高维统计

本文链接：https://blog.csdn.net/L8264367/article/details/50575126

版权

本文回顾了lasso的起源及其在高维统计中的重要性。从传统的选变量方法如Cp统计量、AIC和BIC准则，过渡到岭估计和非负代理，最终详细介绍了lasso及其L1正则化的稀疏性质。通过Lagrangian对偶方法，探讨了lasso的求解过程，包括坐标下降算法和glmnet包的应用。

摘要由CSDN通过智能技术生成

lasso的今世前身

引言
年关将至，少不了写年终总结。自己也绞尽脑汁对研读的统计文献做一个总结。我们来聊聊20年前诞生的lasso。lasso理论文章由统计学家Tibshirani, R在于1996年提出，并获得了里程碑式的影响。简单概述，lasso的目的就是选择合适的自变量。茫茫变量中怎么遇见合适的它。
这里写图片描述

此处说明下我们为什么要进行选变量这个动作？
-变量维数多并且变量之间存在相关关系，所以剔除不重要的变量，选择合适的变量成为了统计学习里面的一个重点。

传统选变量方法

（1）. $C_p$ 统计量
数学公式为： $C_p=\dfrac{RSS_q} {\delta^2}-(n-2q)$

（2）. $AIC$ 准则
数学公式为：AIC= $n\ln(RSS_q)+2q$

（3）. $BIC$ 准则
数学公式： $BIC=-2\ln(RSS_q) + \ln(n)*k$

其中 $RSS_q$ 是在该模型下的残差平方和，q是模型的变量个数。
R语言中有AIC，BIC函数。

lm1 <- lm(Fertility ~ . , data = swiss)
lm2 <- update(lm1, . ~ . -Examination)
AIC(lm1, lm2)
BIC(lm1, lm2)

注意这些规则只是刻画了用某个模型之后相对“真实模型”的信息损失【因为不知道真正的模型是什么样子，所以训练得到的所有模型都只是真实模型的一个近似模型】。

这些规则理论上是比较漂亮的，但是实际在模型选择中应用起来还是有些困难的，
（1）.茫茫变量中这种枚举的方式，计算量太大，典型的NP问题。
（2）.通过这种离散的方式选择变量，模型并不稳定。即数据有许变化，模型就会有所改变。
所以上述方法更适合于模型之间的比较。

岭估计

针对变量之间存在相关性，引入岭的概念，使得 <

最低0.47元/天解锁文章

bxflyquan

关注

7
点赞
踩
31

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录