机器学习-决策树

最新推荐文章于 2024-05-12 21:09:09 发布

z0905073007

最新推荐文章于 2024-05-12 21:09:09 发布

阅读量933

点赞数

分类专栏：机器学习文章标签： python 机器学习决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/z0905073007/article/details/26744865

版权

本文介绍了机器学习中的决策树模型，它是一种基于对象属性的映射关系预测模型。内容涉及决策树的节点类型（决策节点、机会节点、终结点）、熵的概念及其计算公式，并通过Python代码展示了数据集的创建过程。

摘要由CSDN通过智能技术生成

有不足之处，请大家指正，谢谢！

机器学习中，决策树是一个预测模型；他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象，而每个分叉路径则代表的某个可能的属性值，而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出，若欲有复数输出，可以建立独立的决策树以处理不同输出。数据挖掘中决策树是一种经常要用到的技术，可以用于分析数据，同样也可以用来作预测。

从数据产生决策树的机器学习技术叫做决策树学习,通俗说就是决策树。

一个决策树包含三种类型的节点：

决策节点：通常用矩形框来表式
机会节点：通常用圆圈来表式
终结点：通常用三角形来表示

以上资料参考http://zh.wikipedia.org/wiki/决策树

构造决策树，我们需要找到决定性的特征，以划分最好的结果，因此，需要对每个特征进行评估,如果某个特征的信息增益最大，那么该特征就是最好的分离点。

1、如果检测数据集中子项是否属于一类，则返回该子类标签；

2、否则，寻找该子类中的最好特征，划分数据，创建支点；

3、返回步骤1，继续检测下一支点；

熵的定义如下：（参考http://zh.wikipedia.org/wiki/信息熵）

一个值域为{ x₁, ..., x_n}的随机变量 X 的熵值 H 定义为：

H(X) = \operatorname{E}(I(X))

，

其中，E 代表了期望函数，而 I(X) 是 X 的信息量（又称为

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。