决策树 C4.5 公式流程

决策树 C4.5 公式流程

在这里插入图片描述
注意! 这里由2种成分组成:属性(年龄、有工作、有自己的房子、信贷情况)和类别组成。

那么:

  1. 决策类别的信息熵: I n f o ( D ) = ∑ − 每 个 类 别 总 占 比 ∗ ( l o g 2 每 个 类 别 总 占 比 ) Info(D)=\sum - 每个类别总占比 * (log_2每个类别总占比) Info(D)=(log2) 例如: Info(类别)= -6/15x(log26/15) - 9/15x(log29/15)
  2. 每个属性的信息熵: I n f o ( a t t r ) = ∑ a t t r 属 性 每 个 分 类 总 占 比 ∗ [ − a t t r 属 性 每 个 分 类 中 每 个 类 别 的 占 比 ] Info(attr) =\sum attr属性每个分类总占比 * [- attr属性每个分类中 每个类别的占比 ] Info(attr)=attr[attr] 例如:Info(年龄)= 5/15 x (-3/5log23/5 - 2/5log22/5) + 5/15 x (-2/5log22/5 -3/5log23/5) + 5/15 x (-1/5log21/5 - 4/5log24/5)
  3. 信息增益:Gain(attr) = Info(D)-Info(attr) 例如:Info(类别)-Info(年龄)
  4. 内在信息(惩罚): H ( a t t r ) = ∑ − a t t r 每 个 分 类 总 占 比 ∗ l o g 2 a t t r 每 个 分 类 总 占 比 H(attr)=\sum - attr每个分类总占比 * log_2attr每个分类总占比 H(attr)=attrlog2attr 例如H(年龄) = -5/15 x log25/15 - 5/15 x log25/15 -5/15 x log25/15
  5. 信息增益率: IGR(attr) = Gain(attr) / H(attr) 例如:IGR(年龄)=Gain(年龄)/H(年龄)
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

萌新待开发

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值