数据挖掘之决策树

最新推荐文章于 2023-07-04 23:21:09 发布

zjlamp

最新推荐文章于 2023-07-04 23:21:09 发布

阅读量2.9k

点赞数

分类专栏：数据挖掘文章标签：数据挖掘决策树

本文链接：https://blog.csdn.net/zjlamp/article/details/81586039

版权

决策树是一种基于属性划分的分类模型，通过自上而下的递归过程构造树状结构。ID3算法是常见的决策树构建算法，它通过计算信息增益来选择最佳属性进行拆分，直到形成纯度高的叶子节点。数据挖掘中，决策树常用于简化复杂决策流程，便于理解和解释。

摘要由CSDN通过智能技术生成

决策树是一个树状结构，它的每一个叶节点对应着一个分类，非叶节点对应在某个属性上的划分，根据样本在该属性上的不同取值将其划分为若干个子集。

构造决策树的核心问题是在每一步如何选择适当的属性对样本进行拆分。对一个分类问题，从已知类标记的训练样本中学习并构造出决策树是一个自上而下、分而治之的过程。

决策树算法的分类

决策树算法	算法描述
ID3算法	核心是在决策树的各级节点上，使用信息增益方法作为属性的选择标准
C4.5算法	相对于ID3算法，采用信息增益率来选择节点属性。 ID3算法只适用于离散的描述属性；C4.5算法既能够处理离散的描述属性，也可以处理连续的描述属性
CART算法	一种十分有效的非参数分类和回归方法，通过构建树、修剪树、评估树来构建一个二叉树。当终节点是连续变量时，该树为回归树，当终节点是分类变量时，该树为分类树