R语言：岭回归和LASSO回归

最新推荐文章于 2024-04-22 14:24:51 发布

weixin_47196513

最新推荐文章于 2024-04-22 14:24:51 发布

阅读量8k

点赞数 13

分类专栏： R语言岭回归 LASSO回归文章标签： r语言数据分析

本文链接：https://blog.csdn.net/weixin_47196513/article/details/106764093

版权

一、实验说明岭回归和LASSO回归的原理就是在线性回归的基础上添加了2范数和1范数的惩罚项。这两个模型的关键点是找到一个合理的lambda系数，来平衡模型的方差和偏差，从而得到比较符合实际的回归系数。二、实验过程1. 数据预处理/数据清洗加载相关数据包：install.packages("caret")library(caret)library(glmnet)install.packages("ISLR")library(ISLR)处理哑变量：dummies <- dummy

摘要由CSDN通过智能技术生成

一、实验说明

岭回归和LASSO回归的原理就是在线性回归的基础上添加了2范数和1范数的惩罚项。这两个模型的关键点是找到一个合理的lambda系数，来平衡模型的方差和偏差，从而得到比较符合实际的回归系数。

二、实验过程

1. 数据预处理/数据清洗

加载相关数据包：

install.packages("caret")
library(caret)
library(glmnet)
install.packages("ISLR")
library(ISLR)

处理哑变量：

dummies <- dummyVars(~League+Division+NewLeague, data = Hitters)
dummies <- predict(dummies, newdata = Hitters)

将原数据集与哑变量数据合并：

Hitters_dummy <- cbind(Hitters, dummies)

删除缺失值：

Hitters_dummy <- na.omit(Hitters_dummy)

删除无关变量：

Hitters_dummy <- subset(Hitters_dummy, 
                       select = -c(League,Division,NewLeague,League.N,Division.W,NewLeague.N))

然后就可以基于清洗过后的数据集进行建模。
在建立模型之前将数据拆分为训练集和测试集&

最低0.47元/天解锁文章

weixin_47196513

关注

13
点赞
踩
153

收藏

觉得还不错? 一键收藏
3
评论
R语言：岭回归和LASSO回归

一、实验说明岭回归和LASSO回归的原理就是在线性回归的基础上添加了2范数和1范数的惩罚项。这两个模型的关键点是找到一个合理的lambda系数，来平衡模型的方差和偏差，从而得到比较符合实际的回归系数。二、实验过程1. 数据预处理/数据清洗加载相关数据包：install.packages("caret")library(caret)library(glmnet)install.packages("ISLR")library(ISLR)处理哑变量：dummies <- dummy
复制链接

扫一扫