决策树：ID3、C4.5、CART决策树生成算法

最新推荐文章于 2023-02-20 00:24:45 发布

条件反射104

最新推荐文章于 2023-02-20 00:24:45 发布

阅读量2.3k

点赞数 1

分类专栏： machine learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40317204/article/details/105319826

版权

machine learning 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

文章目录

示例训练数据
ID3生成算法
C4.5生成算法
CART生成算法
- 1. CART回归树的生成
- 2. CART分类树的生成

示例训练数据

以如下数据集为例分别介绍决策树ID3、C4.5、CART的生成算法：
在这里插入图片描述

ID3生成算法

在这里插入图片描述

例题：利用训练数据集，用ID3算法建立决策树。

ID3算法只有树的生成，所以该算法生成的树容易产生过拟合。

C4.5生成算法

C4.5与ID3类似，但有一点不同，C4.5在生成的过程中使用了信息增益比来选择特征。
在这里插入图片描述

CART生成算法

CART假设决策树是二叉树，内部结点特征的取值为“是”和“否”。左分支“是”，右分支“否”。

与ID3和C4.5只有决策树的生成不同的是，CART算法由以下两步组成：
（1）决策树生成：基于训练数据集生成一棵尽量大的决策树。
（2）决策树剪枝：用验证数据集对已生成的树进行剪枝并选择最优子树，这时用损失函数最小作为剪枝的标准。

在此文章，只叙述关于决策树生成的算法！

对回归树用平方误差最小化准则；对分类树用基尼指数最小化准则。生成二叉决策树。

1. CART回归树的生成

对于CART回归树的文字性解释如下：
在这里插入图片描述

算法叙述如下：

2. CART分类树的生成

分类树用基尼系数选择最有特征，同时也决定该特征的最优二值切分点。因此，首先对基尼系数做如下符号说明：
在这里插入图片描述
算法描述如下：

特别的，对于基尼指数，有如下结论：

相应例题如下：

对于本问题，按照CART算法生成的决策树与按照ID3算法生成的决策树完全一致。

参考资料：

李航《统计学习方法》

条件反射104

关注

1
点赞
踩
22

收藏

觉得还不错? 一键收藏
1
评论
决策树：ID3、C4.5、CART决策树生成算法

示例训练数据以如下数据集为例分别介绍决策树ID3、C4.5、CART的生成算法：ID3生成算法例题：利用训练数据集，用ID3算法建立决策树。ID3算法只有树的生成，所以该算法生成的树容易产生过拟合。C4.5生成算法C4.5与ID3类似，但有一点不同，C4.5在生成的过程中使用了信息增益比来选择特征。CART生成算法CART假设决策树是二叉树，内部结点特征的取值为“是”和“...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。