【算法】一个简单的决策树（DT）原理

最新推荐文章于 2024-06-24 18:02:39 发布

YaoYee_7

最新推荐文章于 2024-06-24 18:02:39 发布

阅读量797

点赞数

分类专栏： AI

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/YaoYee_21/article/details/119334571

版权

AI 专栏收录该内容

26 篇文章

订阅专栏

在这里插入图片描述

基本原理

决策树是由一系列树状的节点构成，每一个节点代表一个特征并具有相应的决策规则。所有样本从根节点不断划分到子节点，直到叶子节点结束流程，实现分类。

决策树的构建过程就是确定特征的顺序和对应的决策规则。

构建方法

交互式二分法（ID3），采用香农信息论中定义的熵作为度量，其反应该节点上的特征对样本分类的不纯度。假设采用特征A为根节点，计算下一级熵不纯度比上一级熵不纯度的减少量（信息增益），选择最大的信息增益对应的特征作为根节点，以此选取下面的子节点。

剪枝

在有限的样本中如果决策树的规模太大，容易捕捉到训练集中的噪声，影响模型的泛化能力。所以，有必要对模型进行剪枝。主要分为先剪枝和后剪枝：

先减枝：在决策树生长的过程中，判断某节点是否需要继续分支（以分类错误率为标准）
后减枝：从叶节点出发，如果消除相同父节点的叶节点后熵不纯度没有明显下降，则进行删除（以分类错误率为标准）

猜你喜欢：👇🏻
⭐【算法】一个简单的随机森林（RF）原理
⭐【算法】一个简单的支持向量机（SVM）原理
⭐【算法】一个简单的ISODATA原理

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。