R语言实战:构建岭回归模型
岭回归(Ridge Regression)是一种常用的线性回归方法,它通过加入L2正则化项来解决多重共线性问题。本文将介绍如何使用R语言构建岭回归模型,并提供相应的源代码。
1. 数据准备
首先,我们需要准备用于建模的数据。这里以一个虚拟的数据集为例,其中包含自变量X和因变量Y。请根据实际情况替换为您的数据。
# 生成虚拟数据
set.seed(123)
n <- 100 # 样本数量
p <- 5 # 自变量数量
# 生成自变量
X <- matrix(rnorm(n * p), ncol = p)
# 生成因变量
beta_true <- c(2, 1, -1, 0, 0)
Y <- X %*% beta_true + rnorm(n)
# 将数据划分为训练集和测试集
train_indices <- sample(1:n, n * 0.8)
train_X <- X[train_indices, ]
train_Y <- Y[train_indices]
test_X <- X[-train_indices, ]
test_Y <- Y[-train_indices]
2. 构建岭回归模型
接下来,我们使用glmnet
包中的cv.glmnet
函数构建岭