lasso算法学习

最新推荐文章于 2024-07-29 20:45:31 发布

Tavia_YingWa

最新推荐文章于 2024-07-29 20:45:31 发布

阅读量2.4w

点赞数 5

分类专栏：机器学习文章标签：算法

本文链接：https://blog.csdn.net/sinat_31407371/article/details/70238115

版权

Lasso算法是一种压缩估计方法，通过构造罚函数在保持模型解释力的同时精简变量集合。与最小二乘法相比，Lasso具备shrinkage和selection功能，能够在模型中设定部分回归系数为零，实现变量选择。此外，Lasso是岭回归的扩展，解决了岭回归未解决的变量选择问题。LARS算法与Lasso的结合为变量选择提供了新的视角，并在高维数据和时间序列模型中展现出应用潜力。

摘要由CSDN通过智能技术生成

1.lasso族算法说明
在建立模型之初，为了尽量减小因缺少重要自变量而出现的模型偏差，通常会选择尽可能多的自变量。然而，建模过程需要寻找对因变量最具有强解释力的自变量集合，也就是通过自变量选择(指标选择、字段选择)来提高模型的解释性和预测精度。指标选择在统计建模过程中是极其重要的问题。Lasso算法则是一种能够实现指标集合精简的估计方法。
Lasso(Least absolute shrinkage and selection operator, Tibshirani(1996))方法是一种压缩估计。它通过构造一个罚函数得到一个较为精炼的模型，使得它压缩一些系数，同时设定一些系数为零。因此保留了子集收缩的优点，是一种处理具有复共线性数据的有偏估计。
Lasso 的基本思想是在回归系数的绝对值之和小于一个常数的约束条件下，使残差平方和最小化，从而能够产生某些严格等于0 的回归系数，得到可以解释的模型。R的Lars 算法的软件包提供了Lasso编程，我们根据模型改进的需要，可以给出Lasso算法，并利用AIC准则和BIC准则给统计模型的变量做一个截断，进而达到降维的目的。因此，我们通过研究Lasso可以将其更好的应用到变量选择中去。
lasso estimate具有shrinkage和selection两种功能，shrinkage这个不用多讲，本科期间学过回归分析的同学应该都知道岭估计会有shrinkage的功效，lasso也同样。关于selection功能，Tibshirani提出，当t值小到一定程度的时候，lasso estimate会使得某些回归系数的估值是0，这确实是起到了变量选择的作用。当t不断增大时，选入回归模型的变量会逐渐增多，当t增大到某个值时，所有变量都入选了回归模型，这个时候得到的回归模型的系数是