R语言专题，如何使用party包构建决策树？

最新推荐文章于 2022-11-17 08:00:00 发布

计算所培训中心

最新推荐文章于 2022-11-17 08:00:00 发布

阅读量5.1k

点赞数 1

分类专栏：技术知识文章标签： r语言大数据实例

本文链接：https://blog.csdn.net/tcict/article/details/77941438

版权

本文通过实例详细讲解了如何使用R语言的party包在iris数据集上构建决策树，包括数据预处理、模型训练、预测及决策树简化，并探讨了决策树算法在处理缺失值和分类变量水平值不同时的问题及解决方案。

摘要由CSDN通过智能技术生成

下面将在iris数据集上，演示如何使用party包中的函数ctree来建立一棵决策树。

iris数据集中的Sepal.Length、Sepal.Width、Petal.Length和Petal.Width，都将用来预测鸢尾花的种类。
party包中的函数ctree用来建立决策树，函数predict用来对新数据进行预测。

建模之前，将iris数据集划分为两个子集：其中70%的数据用于训练，剩下的30%做测试，为了获得可重现的结果，随机种子设定为固定值。

str(iris)
set.seed(1234)
ind <- sample(2, nrow(iris), replace=TRUE, prob=c(0.7, 0.3))
trainData <- iris[ind==1,]
testData <- iris[ind==2,]
下面先加载party包，并建立一棵决策树，然后查看预测结果。
函数ctree用于控制决策树训练的几个参数是，minSplit、MinBusket、Maxsurrogate和MaxDepth。

决策树，使用这几个参数的默认设置来建立一棵决策树。

代码中，myFormula指定了Species为目标变量，其余的所有变量为自变量。
library(party)
myFormula <- Species ~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width
iris_ctree <- ctree(myFor