基于R语言的分类算法之CART决策树

本文介绍了如何使用R语言的rpart库构建CART决策树。通过基尼指数增益最大化原则建立二叉树,将具有多个离散变量的特征转化为二元比较。示例中,利用iris数据集进行训练和测试,结果显示模型的准确率达到了0.973。
摘要由CSDN通过智能技术生成

CART决策树

“这棵树看起来生气了”——伐木机


基于基尼指数增益最大化的原则,二叉树形式,如果特征变量拥有多个离散变量,则变成二叉树形式。

例如学历有本科、硕士、博士,就转化成,本科-非本科(硕士或者博士),硕士-非硕士(本科或者博士),博士-非博士(本科或者硕士)


代码

library(rpart)

library(rpart.plot)


#iris分成训练集和测试集

set.seed(1234)
index <- sample(1:nrow(iris), size = 0.75*nrow(iris))
train <- iris[index,]
test <- iris[-index,]

fit1 <- rpar

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值