西瓜书第四章决策树

//现在决策树的应用,主流是放在集成学习里面,多棵决策树构成森林模型

1.基本流程

顾名思义,决策树是基于树结构来进行决策的.决策树学习的目的是为了产生一棵泛化能力强,即处理未见示例能力强的决策树,其基本流程遵循简单且直观的"分而治之" (divide-and-conquer) 策略image

 

2.划分选择

决策树学习的关键是如何选择最优划分属性一般而言,随着划分过程不断进行,我们希望决策树的分支结点所包含的样本尽可能属于同一类别,即结点的"纯度" (purity) 越来越高. (就是卡的准呗!!!)

信息熵

自信息

image

随机变量X的每个取值x都有一个p(x)

 

"信息熵" (information entropy) 是度量样本集合纯度最常用的一种指标.是子信息的期望。

image

image​​

 

ID3决策树

C4.5决策树

CART决策树

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

匿名momo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值