ID3划分数据集

http://en.wikipedia.org/wiki/ID3_algorithm

决策树学习中,ID3(迭代二分法器3)是Ross Quinlan [1]发明的一种算法用于从数据集中生成决策树。ID3是C4.5算法的前身,通常用于机器学习自然语言处理领域。

算法

ID3算法从原始集合开始S作为根节点。在算法的每次迭代中,都会遍历集合中每个未使用的属性S并计算出H(S)或信息获取IG(S)该属性的。然后,它选择具有最小熵(或最大信息增益)值的属性。套装S然后根据所选属性对数据进行拆分或分区,以生成数据的子集。(例如,可以根据年龄小于50,介于50和100之间以及大于100的总体子集将一个节点划分为子节点。)该算法继续对每个子集进行递归,仅考虑从不考虑属性的情况。之前选择的。

在以下情况之一中,子集上的递归可能会停止

  • 子集中的每个元素都属于同一类;
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值