lasso最小角_R语言实现LASSO回归模型

最新推荐文章于 2024-08-14 17:31:38 发布

常爸-黄任

最新推荐文章于 2024-08-14 17:31:38 发布

阅读量2k

点赞数 3

文章标签： lasso最小角

本文链接：https://blog.csdn.net/weixin_30855745/article/details/112377932

版权

本文介绍了在R语言中如何使用lars包实现LASSO最小角回归模型。通过lars函数建立模型，并利用cv.lars进行交叉验证找到最优步数，从而得到最佳回归系数。最后，使用predict函数进行预测，展示模型的应用。

摘要由CSDN通过智能技术生成

我们知道广义线性模型包括了一维连续因变量、多维连续因变量、非负次数因变量、二元离散因变量、多元离散因变等的回归模型。然而LASSO对以上的数据类型都适合，也可以说LASSO 回归的特点是在拟合广义线性模型的同时进行变量筛选(variable selection)和复杂度调整(regularization)。变量筛选是指不把所有的变量都放入模型中进行拟合，而是有选择的把变量放入模型从而得到更好的性能参数。复杂度调整是指通过一系列参数控制模型的复杂度，从而避免过度拟合(Overfitting)。总的来说LASSO对数据的要求很低。对于线性模型来说，复杂度与模型的变量数有直接关系，变量数越多，模型复杂度就越高。更多的变量在拟合时往往可以给出一个看似更好的模型，但是同时也面临过度拟合的危险。此时如果用全新的数据去验证模型(validation)，通常效果很差。一般来说，变量数大于数据点数量很多，或者某一个离散变量有太多独特值时，都有可能过度拟合。

今天我们给大家介绍下在R语言如何实现LASSO模型构建，其中有两个包是可以实现的(glmnet和lars)。因为glmnet涉及范围涉及广义线性模型，我们就主要介绍下lars是怎么实现LASSO的。包的安装我就不多讲了，install.pacakges(),你懂的。

首先我们看下其函数lars()。该函数提供了通过回归变量x和因变量y求解其回归模型。