决策树分类算法-ID3算法原理

本文介绍了ID3决策树算法的基本策略,包括信息熵和信息增益的概念。算法通过递归地选择最佳属性划分样本,直到所有样本属于同一类别、无属性可选或分支无样本。信息增益作为属性选择标准,但存在依赖于特征数量和非递增等缺点。
摘要由CSDN通过智能技术生成

ID3基本策略:

1)树根代表训练样本的单个节点的开始;

(2)如果样本都在同一个类中,则这个节点称为树叶节点并标记为该类别。

(3)否则算法使用信息熵(信息增益)作为启发知识来帮助选择合适的将样本分类的属性,以便将样本集划分为若干子集,该属性就是相应节点的“测试”或“判定”属性,同时所有属性应当是离散值。

(4)对测试属性的每个已知的离散值创建一个分支,并据此划分样本。

(5)算法使用类似的方法,递归的形成每个划分上的样本决策树,一个属性一旦出现在某个节点上,那么它就不能再出现在该节点之后所产生的子树节点中;

(6)整个递归过程在下列条件之一成立时停止。

a)给定节点的所有样本属于同一类

b)没有剩余属性可以用来进一步划分样本这时候该节点作为树叶,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值