【R语言】数据分析模型——决策树模型构建实例

专业技术人猿

于 2021-05-11 23:06:56 发布

阅读量2.5k

点赞数 6

分类专栏： R语言文章标签：决策树 r语言数据分析

本文链接：https://blog.csdn.net/weixin_44992694/article/details/116672541

版权

本文通过R语言构建决策树模型，以判别垃圾邮件（spam）为例，介绍了数据加载、训练集与测试集划分、决策树构建及修剪过程。通过调整复杂度参数cp，得到简洁的决策树，预测准确率达到90.0%，减少了好邮件误判为垃圾邮件的情况。

摘要由CSDN通过智能技术生成

判别垃圾邮件spam实例（0：好邮件，1：垃圾邮件）

载入需要的包，加载数据。

install.packages("rpart")
library(rpart)
require(rpart)
install.packages("rpart.plot")
library(rpart.plot)
require(rpart.plot)
install.packages("pROC")
library(pROC)
require(pROC)
X <- read.csv("spamTrain.csv")

随机生成训练集和测试机。

# p=0.7，训练集和测试集比例7:3

split.data = function(data, p = 0.7, s = 666){
  set.seed(s)
  index = sample(1:dim(data)[1])
  train = data[index[1:floor(dim(data)[1] * p)], ]
  test = data[index[((ceiling(dim(data)[1] * p)) + 1):dim(data)[1]], ]
  return(list(train = train, test = test))}

trainset<-split.data(X)$train
testset<-split.data(X)$test

画出完整的决策树，不作任何修剪cp=0，图像非常复杂。

tr1 <- rpart(spam ~ ., data=trainset, me

最低0.47元/天解锁文章

专业技术人猿

关注

6
点赞
踩
41

收藏

觉得还不错? 一键收藏
打赏
2
评论
【R语言】数据分析模型——决策树模型构建实例

判别垃圾邮件spam实例（0：好邮件，1：垃圾邮件）载入需要的包，加载数据。install.packages("rpart")library(rpart)require(rpart)install.packages("rpart.plot")library(rpart.plot)require(rpart.plot)install.packages("pROC")library(pROC)require(pROC)X <- read.csv("spamTrain.csv")
复制链接

扫一扫