决策树

最新推荐文章于 2023-06-22 12:06:34 发布

Wind_know

最新推荐文章于 2023-06-22 12:06:34 发布

阅读量468

点赞数

分类专栏：决策树机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Wind_know/article/details/106650499

版权

机器学习同时被 2 个专栏收录

28 篇文章 2 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

目录

决策树建立

推导条件熵的定义式

决策树的实例

决策树示意图

决策树学习的生成算法

信息熵

　信息熵是一个数学上颇为抽象的概念，在这里不妨把信息熵理解成某种特定信息的出现概率（离散随机事件的出现概率）。一个系统越是有序，信息熵就越低；反之，一个系统越是混乱，信息熵就越高。信息熵也可以说是系统有序化程度的一个度量。

决策树建立

假设有n个样本，假设有一个根节点，将N个样本列在根节点当中，给出一种分割规则，分为左边和右边分支。后面的依次递归。

概率为1，信息量为0，事件一定发生和不发生，熵都为0，中间0.5的熵最大，离散数据。

条件熵

推导条件熵的定义式

相对熵

互信息

决策树的实例

决策树示意图

决策树是一种树型结构，其中每个内部结点表示在一个属性上的测试，每个分支代表一个测试输出，每个叶结点代表一种类别。决策树学习是以实例为基础的归纳学习。决策树学习采用的是自顶向下的递归方法，其基本思想是以信息熵为度量构造一棵熵值下降最快的树，到叶子节点处的熵值为零，此时每个叶节点中的实例都属于同一类。

决策树学习的生成算法

信息增益

Gini系数

基尼系数是指国际上通用的、用以衡量一个国家或地区居民收入差距的常用指标。基尼系数最大为“1”，最小等于“0”。基尼系数越接近0表明收入分配越是趋向平等。国际惯例把0.2以下视为收入绝对平均，0.2-0.3视为收入比较平均；0.3-0.4视为收入相对合理；0.4-0.5视为收入差距较大，当基尼系数达到0.5以上时，则表示收入悬殊。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。