信息增益与决策树

最新推荐文章于 2024-06-29 21:13:07 发布

六个轱辘

最新推荐文章于 2024-06-29 21:13:07 发布

阅读量5.7k

点赞数 2

分类专栏：机器学习文章标签：决策树机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tjy1220646144/article/details/45561727

版权

本文介绍了决策树的基本原理，包括信息熵、信息增益的概念，用于特征选择。接着详细阐述了决策树的生成、剪枝过程以及正则化的学习损失函数。此外，还探讨了随机森林的构建方法，强调了随机森林通过行、列采样和完全分裂避免过拟合，以及其诸多优点。

摘要由CSDN通过智能技术生成

决策树是一种判别式模型。在一颗分类决策树中，非叶子节点时决策规则，叶子节点是类别。当输入一个特征向量时，按照决策树上的规则从根节点向叶节点移动，最后根据叶节点的类别判定输入向量的类别。决策树也可以用来解决回归问题。

建立一个决策树模型主要有三个步骤：特征选择、决策树的生成、决策树的剪枝。而特征选择时要用到信息增益这个概念。

特征选择：

对于一个随机变量X，它的熵可以表示为：

对于两个随机变量X、Y，在已知X的情况下，Y的条件熵为：

其中，

而信息增益（IG）或互信息（MI）的定义是：

也就是说在已知A的情况下随机变量D的不确定性的减少程度，也就是在我们知道A的情况下获得了多少信息。

如果D是数据类别的随机变量，而A是数据某个特征的随机变量，可以想见使得信息增益最大的特征是最好的特征。因为这个特征可以最大程度上减少我们对类别的不确定性

最低0.47元/天解锁文章

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

六个轱辘 CSDN认证博客专家 CSDN认证企业博客

码龄14年

22: 原创

25万+: 周排名

208万+: 总排名

6万+: 访问

: 等级

852: 积分

12: 粉丝

22: 获赞

18: 评论

36: 收藏

私信

关注

热门文章

分类专栏

最新评论

如何判断双链表是否有环
weixin_40091363: 遍历链表判断当前节点的next.pre 是不是当前节点不可以么
MLE极大似然估计
花落知多少灬: 谢谢楼主，讲的非常清楚
使用KD树进行最近邻查找的例子
「已注销」: 关于kd树看看这篇文章吧说的非常详细还有代码实现 https://leileiluoluo.com/posts/kdtree-algorithm-and-implementation.html
使用KD树进行最近邻查找的例子
lhanchao: 或者说判断是否需要查找父节点的另一子节点区域的标准不是通过比较查找点与当前结点的欧式距离和查找点与当前结点父节点的欧氏距离的，而是比较查找点离结点所在的超平面的距离？
使用KD树进行最近邻查找的例子
lhanchao: kd树找到的最近邻结果不一定是正确的吧？以上面那个例子看，如果查找点为（2，,5）的时候，找到的最近邻就是（4,7）

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。