逻辑回归是一种常用的分类算法,它用于预测二分类问题。在这篇文章中,我们将使用R语言来实现逻辑回归模型。
数据准备
首先,我们需要准备我们的数据。假设我们有一个包含两个特征(X1和X2)和一个二分类目标变量(Y)的数据集。我们可以使用data.frame函数创建一个数据框来存储我们的数据。
# 创建数据框
data <- data.frame(
X1 = c(1, 2, 3, 4, 5),
X2 = c(2, 3, 4, 5, 6),
Y = c(0, 0, 0, 1, 1)
)
数据集分割
为了评估我们模型的性能,我们将数据集分为训练集和测试集。我们可以使用caTools包中的函数sample.split来进行数据集的分割。
# 安装和加载caTools包
install.packages("caTools")
library(caTools)
# 设置随机数种子以确保可重复性
set.seed(123)
# 分割数据集
split <- sample.split(data$Y, SplitRatio = 0.7)
train_data <- subset(data, split == TRUE)
test_data <- subset(data, split == FALSE)