机器学习傻瓜书决策树之信息熵和信息增益 增益率理解

本文深入探讨了信息熵在决策树构建中的作用,通过实例解释了信息熵的数学定义及其直观理解。信息增益作为选择最佳特征的指标,用于最大化系统不确定性的坍缩。通过比较不同特征的信息增益,可以选择最优的划分属性,以最少的步骤达到最佳预测效果。同时,文章还提到了信息增益的局限性,并介绍了增益率的概念,以避免过重视某些特征。整个过程旨在构建最有效的决策树模型,提高预测效率。
摘要由CSDN通过智能技术生成

先给出结论:利用信息增益的目的是为了生成最优决策树,方便在测试集预测

首先给出书上信息熵的数学定义:

举一个通俗例子理解这个公式

接下来理解信息增益

书上公式

 

 光看公式很难理解 但是其实并没有新的数学概念知识(理解公式的目的是获取其现实意义和其现实逻辑)

先给出结论:信息增益其实就是系统经过特征选择后(比如该例选择色泽为特征),过度为下个子系统,子系统与上一个系统的信息熵差值的一个量度,当然越大,说明系统不确定性坍缩的越厉害,这正是我们想要的。毕竟信息熵坍缩为0,就能确定做出抉择了。

类比:速度,速度差,加速度对标于,信息熵 信息增益 增益率

举例解释公式字母含义

上书上例子图

 

解释

 

 

同样的道理,计算其它的信息增益  如图

 可得纹理信息增益最大,根据上面红字结论,选择纹理来划分为第一个节点是最好的,因为系统不确定度坍缩相比于选择其它属性来说是最厉害的,当然选纹理

再接下来每一步节点选取都这样选,就会获得最优路径,也就是说,按照最优路径走,系统不确定度坍缩最快(步骤少),更利于预测时我们得到结果

增益率

先看书上例子

 

 也就是说,假如将编号也引入的话,实际用这个生成树枝,对我们判断并没有用,因此信息增益有弊端,所以引入增益率,与信息增益并用

如下

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值