决策树算法

最新推荐文章于 2024-06-18 15:40:50 发布

云朵上的云

最新推荐文章于 2024-06-18 15:40:50 发布

阅读量2.1k

点赞数 2

分类专栏：机器学习模式识别文章标签：决策树算法、剪枝随机森林信息增益增益率基尼指数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39110198/article/details/103751777

版权

本文介绍了决策树算法的发展历史、基本原理及优化方法。Hunt算法是决策树的基础，用于创建ID3、C4.5和CART等。决策树通过信息增益、增益率和基尼指数选择最佳划分属性，C4.5使用增益率，CART采用基尼指数。剪枝是防止过拟合的重要手段，包括预剪枝和后剪枝。随机森林作为决策树的扩展，引入随机属性选择，提高模型的稳定性和准确性。

摘要由CSDN通过智能技术生成

决策树的起源：

1、最早的决策树算法是由Hunt等人于1966年提出，Hunt算法是许多决策树算法的基础，包括ID3、C4.5和CART等

2、Hunt算法通过将训练记录相继划分为较纯的子集，以递归方式建立决策树。设Dt是与结点t相关联的训练记录集，而y = { y1, y2, …, yc}为类标号

3、Hunt算法的递归定义如下：

（1）如果Dt中所有的记录都属于同一个类yt，则结点t是叶子结点，用yt标记；

（2）如果Dt中包含多个类的记录，则选择一个属性测试条件，将记录划分为较小的子集。对于测试条件的每个输出，创建一个子女结点，并根据测试结果将Dt中的记录分布到子女结点中，然后对每个子女结点递归地调用该算法；

决策树的概述：

一般，一棵决策树包含一个根节点，若干个内部结点和若干个叶结点；叶结点对应于决策结果，其他每个结点对应于一个属性测试；每个结点包含的样本集合根据属性测试的结果划分到子结点中，根结点包含样本全集，从根结点到每个叶结点的路径对应了一个判定的测试序列。决策树学习的目的是产生一棵泛化能力强，即处理未见示例强的决策树。
决策树示意图如下: 椭圆-----内部结点即划分属性方框----叶子节点即分类后的样本

决策树的划分选择

信息增益

信息熵：当前样本集合D中第k类样本所占的比例为pk

信息熵的值越小，则D的纯度越高

信息增益：一般而言，信息增益越大，意味着使用属性a来进行划

最低0.47元/天解锁文章

云朵上的云

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
决策树算法

决策树的起源：1、最早的决策树算法是由Hunt等人于1966年提出，Hunt算法是许多决策树算法的基础，包括ID3、C4.5和CART等2、Hunt算法通过将训练记录相继划分为较纯的子集，以递归方式建立决策树。设Dt是与结点t相关联的训练记录集，而y = { y1, y2, …, yc}为类标号3、Hunt算法的递归定义如下：（1）如果Dt中所有的记录都属于同一个类yt，则结点t是...
复制链接

扫一扫

专栏目录

云朵上的云 CSDN认证博客专家 CSDN认证企业博客

码龄7年

2: 原创

72万+: 周排名

161万+: 总排名

4568: 访问

: 等级

72: 积分

0: 粉丝

5: 获赞

0: 评论

17: 收藏

私信

关注

分类专栏

机器学习 2篇
模式识别 2篇

最新文章

Apriori算法以及ECLAT算法

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。