R语言机器学习系列:决策树回归
决策树是一种常用的机器学习算法,可以用于回归问题。在本文中,我们将介绍如何使用R语言实现决策树回归,并提供相应的源代码。
首先,我们需要安装并加载rpart
包,该包提供了决策树算法的实现。可以使用以下命令安装该包:
install.packages("rpart")
library(rpart)
接下来,我们将使用一个示例数据集来演示决策树回归的过程。假设我们有一个包含自变量(特征)和因变量(目标)的数据集。我们的目标是根据自变量的值来预测因变量的值。
让我们假设数据集的文件名为dataset.csv
,并且数据集包含两个自变量(X1和X2)和一个因变量(Y)。我们可以使用以下代码将数据集加载到R中:
dataset <- read.csv("dataset.csv")
在数据集加载完成后,我们可以将数据集分为训练集和测试集。训练集用于构建决策树模型,而测试集用于评估模型的性能。
set.seed(123) # 设置随机种子以确保结果可重复
train_indices <- sample(1:nrow(dataset), nrow(dataset) * 0.7) # 70% 的数据用于训练
train_data <- dataset[train_indices, ]
test_data <- dataset[-train_indices, ]
接下来&