r语言中对LASSO，Ridge和ElasticNet模型实现

最新推荐文章于 2024-07-22 02:30:22 发布

weixin_34366546

最新推荐文章于 2024-07-22 02:30:22 发布

阅读量4.9k

点赞数 2

文章标签： r语言数据结构与算法

原文链接：https://segmentfault.com/a/1190000015322911

版权

介绍

Glmnet是一个通过惩罚最大似然来拟合广义线性模型的包。正则化路径是针对正则化参数λ的值网格处的套索或弹性网络罚值计算的。该算法速度极快，可以利用输入矩阵中的稀疏性x。它符合线性，逻辑和多项式，泊松和Cox回归模型。可以从拟合模型中做出各种预测。它也可以适合多响应线性回归。

glmnet算法采用循环坐标下降法，它连续优化每个参数上的目标函数并与其他参数固定，并反复循环直至收敛。该软件包还利用强大的规则来有效地限制活动集。由于高效的更新和技术，如热启动和主动集合收敛，我们的算法可以非常快地计算解决方案路径。

该代码可以处理稀疏的输入矩阵格式，以及系数的范围约束。其核心glmnet是一组Fortran子程序，它们使执行速度非常快。

该软件包还包括用于预测和绘图的方法以及执行K倍交叉验证的功能。

首先，我们加载glmnet包：

library(glmnet)

## Loading required package: Matrix## Loaded glmnet 1.9-9

包中使用的默认模型是高斯线性模型或“最小二乘”，我们将在本节中演示。我们加载一组预先创建的数据用于说明。用户可以加载自己的数据，也可以使用保存在工作区中的数据。

load("QuickStartExample.RData")

该命令从该保存的R数据档案中加载输入矩阵x和响应向量y。

我们使用最基本的呼叫来适应模型glmnet。

fit=glmnet(x,y)

“适合”是类的一个对象，glmnet它包含拟合模型的所有相关信息以供进一步使用。我们不鼓励用户直接提取组件。相反，提供对象，如各种方法plot，print，coef和predict，使我们能够更优雅执行这些任务。

我们可以通过执行plot函数来显示系数：