李航统计学习方法习题5.1

定义5.3(信息增益比)特征A对训练数据集D的信息增益比定义为其信息增益与训练数据集D关于特征A的值的熵之比,即

                                                                                                                 

其中,,n是特征A的取值个数。(书本原定义)

习题5.1:根据表5.2所表示的训练数据集,利用信息增益比(C4.5算法)生成决策树。

由题意知:


由于的信息增益比最大,所以选择特征作为根节点的特征,得到


                                                                                         D1只有同一类的样本点。

对于D2再计算信息增益比得


选择特征A2作为D2的根节点

                                                                                                  

该决策树只用了两个特征!与书本的例题相一致。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值