R语言编写决策树（rpart）CART ID3算法

最新推荐文章于 2024-05-20 20:30:45 发布

hustfc

最新推荐文章于 2024-05-20 20:30:45 发布

阅读量5.7w

点赞数 68

分类专栏：机器学习

本文链接：https://blog.csdn.net/weixin_36372879/article/details/80493968

版权

决策树(decision tree)是一类常见的机器学习方法。以二分类任务为例，我们希望从给定训练数据集学得一个模型用以对新示例进行分类，这个把样本分类的任务，可看做对“当前样本属于正常吗？”这个问题的‘决策’或者‘判定’过程。顾名思义，决策树是基于树结构来进行决策的，这恰是人类在面临决策问题时一种很自然的处理机制。

常用的决策树算法：

ID3 以信息增益作为分类标准
CART 以基尼系数作为分类标准
算法的具体理论可以参考周志华的《机器学习》

数据预处理

loc<-"http://archive.ics.uci.edu/ml/machine-learning-databases/"
ds<-"breast-cancer-wisconsin/breast-cancer-wisconsin.data"
url<-paste(loc,ds,sep="")
data<-read.table(url,sep=",",header=F,na.strings="?")
names(data)<-c("编号","肿块厚度","肿块大小","肿块形状","边缘黏附","单个表皮细胞大小","细胞核大小","染色质","细胞核常规","有丝分裂","类别")
#print(data)
data$类别[data$类别==2]<-"良性"
data$类别[data$类别==

最低0.47元/天解锁文章

hustfc

关注

68
点赞
踩
418

收藏

觉得还不错? 一键收藏
18
评论
R语言编写决策树（rpart）CART ID3算法

决策树(decision tree)是一类常见的机器学习方法。以二分类任务为例，我们希望从给定训练数据集学得一个模型用以对新示例进行分类，这个把样本分类的任务，可看做对“当前样本属于正常吗？”这个问题的‘决策’或者‘判定’过程。顾名思义，决策树是基于树结构来进行决策的，这恰是人类在面临决策问题时一种很自然的处理机制。常用的决策树算法：ID3 以信息增益作为分类标准CART 以基尼系...
复制链接

扫一扫