决策树学习算法——ID3,C4.5,CART详解

最新推荐文章于 2024-06-02 12:50:56 发布

仰望夏日

最新推荐文章于 2024-06-02 12:50:56 发布

阅读量5.1k

点赞数 17

文章标签：决策树剪枝

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_49717022/article/details/118891439

版权

一、决策树

决策树的学习过程包括三个步骤：

a）特征选择。不同的特征和预测目标具有不同强度的相关性，选择相关性最强的特征能够有效提高预测效果。

b）节点分裂。训练集会在决策树中按照节点规则分流，如果节点A 没办法给出一个满意的分类结果，那它就会选择分裂，分成 2 个或者多个节点。那么根据什么分裂呢？节点A 会用熵来判断用哪个特征分裂是最优的。

c）剪枝。决策树不加限制地分裂容易产生过拟合现象，剪枝可以一定程度地缓解过拟合，提高泛化能力。

决策树的学习算法有多种，常用的有：ID3，C4.5，CART。下面逐个介绍

1、ID3

前言

在这里插入图片描述

1.1计算公式

在这里插入图片描述

1.2例子

以如下样本为例：
在这里插入图片描述

当我们最左侧的纹理清晰的子集D1进行第二次分裂时，可以计算D1的信息熵：

7好2坏

此时对于 D1 子集的触感属性进行属性不同取值区间的信息熵计算得出，当触感硬滑时：
6好0坏

最低0.47元/天解锁文章

关注

17
点赞
踩
69

收藏

觉得还不错? 一键收藏
4
评论
决策树学习算法——ID3,C4.5,CART详解

一、决策树决策树的学习过程包括三个步骤：a）特征选择。不同的特征和预测目标具有不同强度的相关性，选择相关性最强的特征能够有效提高预测效果。b）节点分裂。训练集会在决策树中按照节点规则分流，如果节点A 没办法给出一个满意的分类结果，那它就会选择分裂，分成 2 个或者多个节点。那么根据什么分裂呢？节点A 会用熵来判断用哪个特征分裂是最优的。c）剪枝。决策树不加限制地分裂容易产生过拟合现象，剪枝可以一定程度地缓解过拟合，提高泛化能力。决策树的学习算法有多种，常用的有：ID3，C4.5，CART。下面逐
复制链接

扫一扫

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。