分类算法之决策树ID3详解

本文详细介绍了ID3决策树算法,通过一个具体的气象数据案例,解释了如何利用信息熵和信息增益来选择最佳属性作为决策树的根节点。分析了风力、湿度、天气和温度四种属性的信息增益,最终选择了信息增益最高的属性作为根节点。文章还指出了ID3算法的优点和局限性,如处理离散属性、容易受属性取值数量影响等。
摘要由CSDN通过智能技术生成

回顾决策树的基本知识,其构建过程主要有下述三个重要的问题:
     (1)数据是怎么分裂的

     (2)如何选择分类的属性

     (3)什么时候停止分裂

     从上述三个问题出发,以实际的例子对ID3算法进行阐述。

先上问题吧,我们统计了14天的气象数据(指标包括outlook,temperature,humidity,windy),并已知这些天气是否打球(play)。如果给出新一天的气象指标数据:sunny,cool,high,TRUE,判断一下会不会去打球。

这个问题当然可以用朴素贝叶斯法求解,分别计算在给定天气条件下打球和不打球的概率,选概率大者作为推测结果。

现在我们使用ID3归纳决策树的方法来求解该问题。

预备知识:

(1)信息熵

(2)信息增益

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值