ID3算法应用举例

利用ID3算法实现从数据集归纳出决策树。

背景:
张三想要买一套房,可能左右他是否愿意购买这套房主要有四个方面的因素,这四种因素及可能出现的值如下表所示:

院子 车库数 楼层数 地理位置
大/小 1/2/3 2/3 城郊/市中心

张三看了14套房子,以下是这些房子具备的属性以及张三对于购买这些房子的意愿:

院子 车库数 楼层数 地理位置 是否愿意购买
3 2 城郊
2 3 市中心
1 3 市中心
2 3 城郊
3 3 市中心
2 3 市中心
2 2 市中心
3 3 城郊
1 2 市中心
1 3 城郊
3 2 城郊
2 2 城郊
1 2 城郊
1 2 城郊

在这14套房中,张三愿意购买的有10套,不愿意购买的有4套。由此可得原表格的熵为:
H ( S ) = − 4 14 l o g 2 4 14 − 10 14 l o g 2 10 14 H(S)=-\frac{4}{14} log_{2}\frac{4}{14}-\frac{10}{14} log_{2}\frac{10}{14} H(S)=144log21441410log21410
每个因素的信息增益:

院子 愿意 不愿意
6 1
4 3

G ( S , 院 子 ) = H ( S ) − ∣ S 大 ∣ ∣ S ∣ H ( S 大 ) − ∣ S 小 ∣ ∣ S ∣ H ( S 小 ) = 0.072 G(S,院子)=H(S)-\frac{|S_{大}|}{|S|}H(S_{大})-\frac{|S_{小}|}{|S|}H(S_{小})=0.072 G(S,)=H(S)SSH(S)SSH(S)=0.072

车库数 愿意 不愿意
1 3 2
2 3 2
3 4 0

G ( S , 车 库 数 ) = H ( S ) − ∣ S 1 ∣ ∣ S ∣ H ( S 1 ) − ∣ S 2 ∣ ∣ S ∣ H ( S 2 ) − ∣ S 3 ∣ ∣ S ∣ H ( S 3 ) = 0.166 G(S,车库数)=H(S)-\frac{|S_{1}|}{|S|}H(S_{1})-\frac{|S_{2}|}{|S|}H(S_{2})-\frac{|S_{3}|}{|S|}H(S_{3})=0.166 G(S,)=H(S)SS1H(S1)SS2H(S2)SS3

  • 21
    点赞
  • 60
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值