机器学习-决策树（求最优信息增益）

最新推荐文章于 2022-10-29 18:15:55 发布

Vivinia_Vivinia

最新推荐文章于 2022-10-29 18:15:55 发布

阅读量753

点赞数

分类专栏：机器学习文章标签： python 机器学习决策树信息增益香农熵

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hester_hester/article/details/96111075

版权

本文介绍了决策树的概念，通过一个相亲对象选择的例子来帮助理解。决策树的构建涉及计算信息增益，以确定最佳特征划分。文章详细说明了如何计算熵，表示标签取值的随机性，并提供了数据集创建、熵计算及信息增益求解的步骤。

摘要由CSDN通过智能技术生成

emmmmmm....有点烧脑子

决策树，通俗的理解就是根据每个问题进行判断，然后最终往下找到答案的过程，类似于一棵树，可以用下图（相亲对象的选择）来理解：

获得一棵决策树，首先要求的最优信息增益，信息增益就是求前边每一列对最最后一列这个可能标签的约束程度，熵代表了最后一列标签取值的随机性（貌似这样吧，我是小渣渣自己这样理解的，头都大了），下图可以看出每种信息增益的情况，可以理解为用哪种特征划分比较合适：

数据集，前四列为 '年龄', '有工作', '有自己的房子', '信贷情况'，最后一列为是否贷款给这个人

下列代码可以分为几个步骤：

1.创建如上数据

最低0.47元/天解锁文章

Vivinia_Vivinia

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
机器学习-决策树（求最优信息增益）

emmmmmm....有点烧脑子决策树，通俗的理解就是根据每个问题进行判断，然后最终往下找到答案的过程，类似于一棵树，可以用下图（相亲对象的选择）来理解：获得一棵决策树，首先要求的最优信息增益，信息增益就是求前边每一列对最最后一列这个可能标签的约束程度，熵代表了最后一列标签取值的随机性（貌似这样吧，我是小渣渣自己这样理解的，头都大了），下图可以看出每种信息增益的情况，可以理解为用...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。