什么是决策树？

最新推荐文章于 2024-10-10 11:20:17 发布

九点前吃饭

最新推荐文章于 2024-10-10 11:20:17 发布

阅读量3.9k

点赞数 4

分类专栏：决策树的入门与实践文章标签：机器学习决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Haiqiang1995/article/details/89599630

版权

决策树的入门与实践专栏收录该内容

2 篇文章 0 订阅

订阅专栏

今天是周六，窗外一片绿色，身处北京能闲暇下来，着实不易～

下面我来解释下什么是决策树，在大学期间我们都接触过二叉树，搜索树，以及数据库中索引的基本原理...和今天要说的决策树，从本质上都是一种基于树这种数据结构的具体实现。

决策树是一个类似于流程图的树结构：其中，每个内部结点表示在一个属性上的测试，每个分支代表一个属性输出，而每个树叶结点代表类或类分布。树的最顶层是根结点。

上述事例是决策小强是否出去和朋友打羽毛球的一棵决策树，可以看到根目录中在没有任何特征（属性）干预的情况，小强有5/14的概率不打球，打球的概率是9/14～

在第一层树中，天气属性作为干扰因素，如果是sunny天，我有2/5的概率打球，还有3/5的概率做其他的事情，比如约会，加班～（当然我没女朋友，加班～）如果是overcast（阴天无雨）打球的概率是1（100%），如果是下雨天，有3/5的概率打球和2/5的概率不打球。

决策树是一种递归算法，可以用当前的分支（branch）当作根（root）节点，继续进行构建..直到～

可能你此时心中会有这些问题，啥时候结束递归流程呢？为啥先选用天气为决策特征呢？如果先选择湿度（humidity|windy）作为决策特征呢，不行吗？

一般来说，决策树在满足以下条件的时候，结束分裂过程

1，当前决策分支中所有的数据都属于同一个类（Play|Don‘t play）,当前分支设置为叶子结点，结束列

2，如果该分支中其他特征没有继续分裂的能力，可以按少数服从多数的投票原则进行选择

3，构建决策树之前我们可以设定结束条件，最大分裂层树，最大叶子树等等

那么特征如何确定选择顺序呢？下一节我会通过计算实例来讲解 --决策树算法--ID3算法，其中会涉及香农定理中的熵，以及信息增益的运算方法。

九点前吃饭

关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。