r语言岭回归参数选择_R语言如何和何时使用glmnet岭回归

最新推荐文章于 2023-01-08 14:49:52 发布

黄亦阳

最新推荐文章于 2023-01-08 14:49:52 发布

阅读量2k

点赞数

文章标签： r语言岭回归参数选择

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_31787547/article/details/111925489

版权

本文介绍了如何在R中使用glmnet包进行岭回归，并通过模拟实验展示了相比于普通最小二乘法，岭回归在处理极端变异和避免过拟合方面的优势。岭回归利用L2正则化提升模型稳定性，通过调整超参数lambda找到最优模型。模拟结果显示，尽管岭回归在训练数据上的预测效果可能不如OLS，但在测试数据上的泛化能力更强，特别是在训练数据量少、特征多的情况下。

摘要由CSDN通过智能技术生成

这里向您展示如何在R中使用glmnet包进行岭回归(使用L2正则化的线性回归)，并使用模拟来演示其相对于普通最小二乘回归的优势。

岭回归

当回归模型的参数被学习时，岭回归使用L2正则化来加权/惩罚残差。在线性回归的背景下，它可以与普通最小二乘法(OLS)进行比较。OLS定义了计算参数估计值(截距和斜率)的函数。它涉及最小化平方残差的总和。L2正则化是OLS函数的一个小增加，以特定的方式对残差进行加权以使参数更加稳定。结果通常是一种适合训练数据的模型，不如OLS更好，但由于它对数据中的极端变异(例如异常值)较不敏感，所以一般性更好。

包

我们将在这篇文章中使用以下软件包：

library(tidyverse)

library(broom)

library(glmnet)

与glmnet的岭回归

glmnet软件包提供了通过岭回归的功能glmnet()。重要的事情要知道：

它不需要接受公式和数据框架，而需要一个矢量输入和预测器矩阵。

您必须指定alpha = 0岭回归。

岭回归涉及调整超参数lambda。glmnet()会为你生成默认值。另外，通常的做法是用lambda参数来定义你自己(我们将这样做)。

以下是使用mtcars数据集的示例：

因为，与OLS回归不同lm()，岭回归涉及调整超参数，lambda，glmnet()为不同的lambda值多次运行模型。我们可以自动找到最适合的lambda值，cv.glmnet()如下所示：

cv_fit

cv.glmnet() 使用交叉验证来计算每个模型的概括性，我们可以将其视为：

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。