决策树

最新推荐文章于 2024-07-10 00:27:04 发布

ALVANAN

最新推荐文章于 2024-07-10 00:27:04 发布

阅读量230

点赞数

分类专栏：机器学习文章标签：数据挖掘机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014458853/article/details/107508083

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

一决策树介绍

决策树是一种基本的分类与回归方法。

决策树模型呈树形结构，在分类问题中，表示基于特征对实例进行分类的过程。可以认为是if-then规则集合。

决策树学习通常包含3个步骤：特征选择、决策树生成、决策树剪枝

二决策树学习过程

1、特征选择

特征选择在于选取对训练数据具有分类能力的特征。特征选择的三个方法

（1）信息增益

缺点：类别做的特征的信息增益会更大，故会偏向于选择类别较多的特征，伊日惠容易产生过拟合的问题

（2）信息增益率

在信息增益基础上产生的方法。校正了信息增益的缺点。每个特征的信息增益/该特征的信息熵

（3）基尼系数

2、决策树生成算法

（1）ID3

算法原理：选用信息增益来进行特征选择，递归的构建决策树。

缺点：（1）容易产生过拟合；（2）不能处理连续变变量

应用：分类问题

（2）C4.5

算法原理：选用信息增益率来进行特征选择，地柜构建特征树。

解决了ID3的缺点问题（可以处理连续变变量）

应用：分类问题

（3）CART

算法原理：采用吉尼斯相互进行特征算则，地柜构建特征树

应用：分类与回归问题均可

3、决策树剪枝

一般通过极小化决策树整体的损失函数或者代价函数来实现

书籍《统计学习方法》

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
决策树

一决策树介绍决策树是一种基本的分类与回归方法。决策树模型呈树形结构，在分类问题中，表示基于特征对实例进行分类的过程。可以认为是if-then规则集合。决策树学习通常包含3个步骤：特征选择、决策树生成、决策树剪枝二决策树学习过程1、特征选择特征选择在于选取对训练数据具有分类能力的特征。特征选择的三个方法（1）信息增益缺点：类别做的特征的信息增益会更大，故会偏向于选择类别较多的特征，伊日惠容易产生过拟合的问题（2）信息增益率在信息增益基础上产生的方法。校正了信息增益.
复制链接

扫一扫

专栏目录

博客等级

码龄10年

17
原创

19
点赞

147
收藏

15
粉丝

关注

私信

热门文章

分类专栏

最新评论

R语言常用帮助函数
weixin_59044884: 您好请问，显示找不到foo函数是为什么呢？
R语言基本画图
跳动的喵尾巴: 您好，有个问题麻烦可以请教您一下嘛，使用这些来绘制多重比较结果图时，弹出的绘图框里显示的图形上方的a,b会有两行显示不完全，但是在RGui里面就可以显示完全，这个是需要怎么调整一下嘛？非常感谢。[code=html] library(multcomp) head(cholesterol) bartlett.test(response~trt,data = cholesterol) fit<- aov(response~trt,data = cholesterol) TukeyHSD(fit) par(mar=c(5,4,6,2)) tuk<-glht(fit,linfct=mcp(trt='Tukey')) plot(cld(tuk,level=0.05),col='lightgreen') [/code]
R语言基本画图
wyd4508922: 相容事件的并集：P(AUB)=P(A)+P(B)-P(A∩B) 独立事件的交集：P(A∩B) = P(A) * P(B) 非独立事件的交集：P(A∩B) = P(A) * P(B|A) 贝叶斯定理:P(A|B)= P(A∩B)/P(B)=P(B|A)P(A)/[P(B|A)P(A)+P(B|~A)P(~A)] dbinom(x,size, prob) 该函数给出了每个点的概率密度分布。某药物治疗某疾病有效率0.7，无效率0.3，计算10人中6人有效概率,dbinom(6,10,0.7) pbinom (x,size, ,prob) 该函数给出事件的累积概率，它用于表示概率的单个值。抛掷硬币100次，正面向上不超过50次的概率，pbinom(50,100,0.5) qbinom(p, size, prob) 该函数采用概率值，并给出其累积值与概率值匹配的数字。抛掷硬币100次，正面向上多少次概率为0.4，qbinom(0.4,100,0.5) rbinom(n ,size,,prob) 该函数从给定样本生成所需数量的给定概率的随机值。 100个样本中，以0.4发生的概率找出10个随机值，rbinom(10,100,0.4) x - 是数字的向量。 p - 是概率向量。 n - 是观察次数。 size - 是试验的次数。 prob - 是每次试验成功的概率。 Plot(x,y，cex.lab=2，cex.axis=2)绘制散点图,cex.lab为横纵坐标注释字体大小，cex.axis为横纵坐标字体大小 Lines（x,y）将散点图连线 legend("topleft",legend=c("A","B","C"),col=c("red","green","blue"),lwd=3,lty=c(1,1,1))加对应折线注释 Abline(v=70,lty=3,lwd=2,col=’red’)添加一条x=70，宽度为2的红色垂线,lty为垂线种类，lwd为垂线宽度，v为垂线，h为横线
R语言读取oracle数据库数据表
qq_35494230: 博主，用R写入Oracle数据库的表，在Oracle里无法用SQL语句查询，显示表或视图不存在，这是怎么回事？数据确定导入成功了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。