数据挖掘之决策树

决策树是一种基于属性划分的分类模型,通过自上而下的递归过程构造树状结构。ID3算法是常见的决策树构建算法,它通过计算信息增益来选择最佳属性进行拆分,直到形成纯度高的叶子节点。数据挖掘中,决策树常用于简化复杂决策流程,便于理解和解释。
摘要由CSDN通过智能技术生成

决策树是一个树状结构,它的每一个叶节点对应着一个分类,非叶节点对应在某个属性上的划分,根据样本在该属性上的不同取值将其划分为若干个子集。

构造决策树的核心问题是在每一步如何选择适当的属性对样本进行拆分。对一个分类问题,从已知类标记的训练样本中学习并构造出决策树是一个自上而下、分而治之的过程。

决策树算法的分类

决策树算法 算法描述
ID3算法 核心是在决策树的各级节点上,使用信息增益方法作为属性的选择标准
C4.5算法

相对于ID3算法,采用信息增益率来选择节点属性。

ID3算法只适用于离散的描述属性;C4.5算法既能够处理离散的描述属性,也可以处理连续的描述属性

CART算法 一种十分有效的非参数分类和回归方法,通过构建树、修剪树、评估树来构建一个二叉树。当终节点是连续变量时,该树为回归树,当终节点是分类变量时,该树为分类树

 

ID3算法的具体流程:

1、对当前样本集合,计算所有属性的信息增益;

2、选择信息增益最大的属性作为测试属性,把测试属性取值相同的样本划为同一个子样本集;

3、若子样本集的类别属性只含有单个属性,则分支为叶子节点,判断其属性值并标上相应的符号,然后返回调用处ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值