【Python机器学习】理论知识：决策树

最新推荐文章于 2024-10-14 14:35:06 发布

zhangbin_237

最新推荐文章于 2024-10-14 14:35:06 发布

阅读量787

点赞数 12

分类专栏： Python机器学习文章标签：机器学习 python 决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39407597/article/details/135463525

版权

Python机器学习专栏收录该内容

225 篇文章 2 订阅

订阅专栏

决策树是一种基于if/else问题的模型，用于分类和回归任务。通过监督学习从数据中自动构建模型，它通过递归划分特征空间，形成纯的叶节点进行预测。预测时，新数据点根据特征测试沿树遍历，目标值由叶节点的多数决定或取平均值。

摘要由CSDN通过智能技术生成

决策树是广泛用于分类和回归任务的模型，本质上是从一层层if/else问题中进行学习，并得出结论。这些问题类似于“是不是”中可能问到的问题。

决策树的每个结点代表一个问题或一个包含答案的终结点（叶结点）。树的边奖问题的答案与将问的下一个问题连接起来。

用机器学习的语言来说，，为了得到预测结果，利用多个特征构建一个模型，可以利用监督学习从数据中学习模型，而不需要人为构建模型。

学习决策树，就是学习一系列if/else问题，使我们能够最快的速度得到正确答案。在机器学习中，这些问题就叫做测试。数据通常不具有二元特征（是/否），而是表现为连续特征。为了构造决策树，算法搜遍所有可能得测试，找到对目标变量来说信息量最大的一个。

顶结点（也叫根结点）表示整个数据集，包含属于类别0的所有点和类别1的所有点，通过测试的真假来对数据集进行区分。递归生成二元决策树，其中每个结点都包含一个测试。

对数据反复进行递归，直到划分后的每个区域都只包含单一目标值（单一类别或单一回归值）。如果树中某个叶结点包含的数据点的目标值都相同，那么这个叶结点就是纯的。

想要对新的数据点进行预测，首先要查看这个点位于特征空间划分的哪个区域，然后将该区域的多数目标值作为预测结果。从根结点开始对树进行遍历就可以找到这个区域，每一步向左还是向右取决于是否满足相应的测试。

决策树也可以用于回归任务，使用的方法相同。预测的方法是基于每个结点的测试对树进行遍历，最终找到新数据点所属的叶结点，这个数据点的输出也就是这个叶结点中所有训练点的平均目标值。

关注

12
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。