西瓜书之决策树的一生

最近看西瓜书的决策树这一章,给我看懵了。感觉得自己动手一步一步计算才能理解具体怎么构造的,然后才能写程序。就以书上的西瓜集2.0为例:

1.先搞清两个概念: 信息熵和信息增益

信息熵越小,纯度越高。计算公式如下:

在这里插入图片描述
条件熵:
在这里插入图片描述
信息增益越大,意味着获得的“纯属提升”越大。因此我们使用信息增益来进行决策树的划分属性选择。
在这里插入图片描述
计算过程如下:
在这里插入图片描述
插一句题外话,由上图可见手机镜头会让原图发生凹凸变化,所以镜子里的我才是真实的哈哈哈哈哈,其实是因为镜子里的我比相机好看>0<~~~
在这里插入图片描述
但是信息增益存在的问题,它对数目较多的属性有所偏好。为了减少这种偏好可能带来的不利影响,
引入增益率的概念:
在这里插入图片描述
在这里插入图片描述
增益率则是对可取数目较少的属性有偏好,所以先从候选划分属性中找出信息增益高于平均水平的属性,再从中选择增益率最高的。

2.接下来进行剪枝处理
目的:对付过拟合
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

花里梦雨

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值