决策树中熵的理解

最新推荐文章于 2024-05-22 11:25:42 发布

SherryQiao

最新推荐文章于 2024-05-22 11:25:42 发布

阅读量6.5k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SherryQiao/article/details/54410773

版权

决策树是用于分类的统计模型。

熵的概念

熵是来衡量随机变量的不确定性的。Shannon entropy来定量化了这种不确定性。
有以下公式

H (x) = \sum i P (x i) I (x i) = - \sum i P (x i) l o g b P (x i)

$H(x)=\sum_{i}P(x_i)I(x_i)=-\sum_{i}P(x_i)log_bP(x_i)$

接下来通过例子来说明。
比如投硬币，正面和反面的概率都是1/2，在这种情况下，一个比特就可以来传递每一次的结果。投了4次硬币，2次正面，2次反面。根据香农公式那么熵就为E1=-1/2log2(1/2)-1/2log2(1/2)=1
同理如果每次都是证明的话，那么熵为0.

接下来来理解一下比特（bits）的概念
考虑三种可能结果的情况，正，负，中三种结果。其中正的结果2次，负的结果1次，中的结果1次。根据公式熵为1.5.

信息增益

信息增益是用来选取属性的。被选择的分类属性，信息增益是最高的。
信息增益的方法会偏向于选择将样本分为多类的属性，而这个属性对于机器学习可能是没有意义的。
因此用信息增益的方式来选取特征。
比如对于特征A的信息增益有以下公式

G a i n (A) = I n f o (D) - I n f o A (D)

$Gain(A)=Info(D)-Info_A(D)$
where

I n f

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
决策树中熵的理解

熵，信息增益
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。