机器学习经典算法：决策树模型（Decision Tress）

最新推荐文章于 2025-05-15 18:41:48 发布

倪桦

最新推荐文章于 2025-05-15 18:41:48 发布

阅读量1.4k

点赞数 27

分类专栏：机器学习经典算法文章标签：机器学习算法决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Nh_code/article/details/144055579

版权

决策树是一种用于分类和回归任务的 非参数监督学习算法。该算法在于基于训练数据生成一个树形的决策结构。树形的决策结构的执行逻辑由根节点、分支、内部节点和叶节点组成。其中每个节点表示一个属性上的判断，每个分支代表一个判断结果的输出，最后的每个叶节点代表一种判别结果。基于树形判别结构，决策树天然地用于解决多分类问题（分类决策树）。决策树同时也能够解决回归问题，回归数值最后由样例所进入的叶子节点内的训练样本取均值可得（回归决策树）。决策树基于属性判断的特点，也使得决策树的输出结果具有非常好的可解释性。

在处理数值特征的分类问题的时候，决策树算法会为每个节点上选择某一个特征和特征阈值建立判断条件和判断输出建立决策树。【生成一棵决策树的关键在于 如何为每个判断节点选取合适的特征和特征阈值 作为数据的划分依据。】

1、信息熵建树的策略

1.1 信息熵简介

在信息论中，信息熵（information entropy，香农熵） 提出用来量化度量一个系统的混乱程度(不确定程度)。熵越大，有数据的不确定性越高；熵越小，有数据的不确定性越低。

$-\sum_{i=1}^{k} p_i(\log(p_i))$
$p_i$ 描述了一个系统内某类事件发生的概率，简单理解为系统内一类群体的比例。

关于信息熵所度量的系统混乱程度的直观理解
对于包含3个类群( $a,$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

倪桦 有帮助的话请杯咖啡吧，谢谢！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。