（统计学习方法|李航）第五章决策树——一二三节：决策树模型与学习，特征选择，决策树的生成，

Allenspringfestival

已于 2023-08-12 14:27:02 修改

阅读量1.3k

点赞数

分类专栏：机器学习基础文章标签：学习方法决策树算法

于 2023-08-07 10:34:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_57848728/article/details/132141301

版权

机器学习基础专栏收录该内容

13 篇文章 2 订阅

订阅专栏

本文介绍了决策树模型，包括其与if-then规则的关系、条件概率分布的应用，以及特征选择中的信息增益和信息增益比。重点讲解了ID3算法和C4.5算法在决策树生成中的应用，通过实例解析了特征选择的过程和信息增益比的优势。

摘要由CSDN通过智能技术生成

目录

一，决策树模型与学习

1.决策数模型

2.决策树与if-then规则

3.决策树与条件概率分布

4.决策树学习

二，特征选择

1.特征选择问题

3.信息增益比

三，决策树的生成

2.C4.5的生成算法

kd树是一个二叉树

但是决策树不是

而是多叉树

一，决策树模型与学习

1.决策树模型

圆圈为内部节点，表示特征（属性)

叶子节点是类别。

2.决策树与if-then规则

if then 规则满足互斥完备规则

3.决策树与条件概率分布

单元C表示乌云密布，狂风大作

4.决策树学习

3个特征，2类

举出一个实例

二，特征选择

1.特征选择问题

选择不同的特征放在根节点，那么得到的决策树是不一样的。

2.信息增益

筛子点每个点概率都为1/6，此时的熵最大。

例题解说

从而我们可以得到训练数据集的经验熵

我们以年龄这个属性为例子：

那么什么是经验条件熵呢？

然后算出经验条件熵：

接下来我们来看有工作这个属性：

经验熵为：

经验条件熵：

下面是看有房子这个特征：

信息增益就是经验熵减去经验条件熵。

有自己的房子这个特征信息增益最大，选择他为最优特征

选为根节点。

3.信息增益比

在比较信息增益时：

有自己的房子>信贷情况>有工作

有没有可能信贷情况的取值较多
导致了它的信息增益大于有工作
为了消除特征属性中域的个数对信息增益的影响，我们引出了信息增益比

我们可以分别算出（与类别属性无关）

不同特征的信息熵。

g（D,A）就是信息增益比
HA（D）不同属性间的信息熵
gR（D,A）是信息增益比

我们observe：

在比较信息增益时，我们有信贷情况大于有工作，说明对类别属性影响更大
但是消除了特征属性的取值个数不同后
比较信息增益比，那么有工作大于信贷情况

信息增益倾向于取值较多的特征

信息增益比倾向于取值较少的特征

三，决策树的生成

算法解说

1.ID3算法（采用信息增益选取最优特征）

不需要特征选择，类别属性都是晴天，生成但结点数T
特征集A为空基，也不需要特征选择，20天数据里面只有类别（18天晴天，2天阴天）记录晴天

2.C4.5的生成算法（采用信息增益比为最有特征）

（1）数据集可以是连续数据（非离散）

（2）摆脱了特征属性的取值过多对判断最有特征的影响

例题讲解

伊普西隆表示尽可能小的数

开始选择有自己的房子为根节点

然后对D2的子集继续分类

求没有自己房子的经验熵

经验条件熵：

那么在没有自己房子的人中的经验条件熵就求出来了

接着我们去计算有工作的经验条件熵：

信贷情况的经验条件熵：

整理出来：

有工作信息增益最大，下一个结点为有工作

整个决策树只用了两个特征

Allenspringfestival

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
（统计学习方法|李航）第五章决策树——一二三节：决策树模型与学习，特征选择，决策树的生成，

目录一，决策树模型与学习1.决策数模型2.决策树与if-then规则3.决策树与条件概率分布4.决策树学习二，特征选择1.特征选择问题2.信息增益3.信息增益比三，决策树的生成1.ID3算法2.C4.5的生成算法
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。