决策树:介绍信息熵-信息增益-决策树信息增益法构造决策树

什么是熵

  • 熵,表示事物的不确定性
  • 信息,可以消除不确定性的事物
    • 看见某些特定的情况下,某些后果的成功率就变高了
    • 看见某些特定的情况下,某些干扰就消除了
  • 噪音,白白让人浪费注意力的东西,完全没用

信息熵的公式 是怎么推倒出来的

  • 此处参考 “致敬大神”里啃西瓜书的B站视频
  • 个人感觉讲的极好
  • 首先先声明信息熵公式 E n t ( D ) = − ∑ k = 0 ∣ y ∣ p k l o g 2 p k Ent(D) = -\sum_{k=0}^{ {\mid}y{\mid}}p_k{log_2}p_k Ent(D)=k=0ypklog2pk

y y y是出现的后果, ∣ y ∣ \mid{y}\mid y是后果种类, p k p_k pk为第 k k k中情况出现的概率

骰子投掷次数 可能结果种类
1 2
2 4
3 8
n n n 2 n 2^n 2n

这里举一个 可能结果均匀分布的抛骰子例子:

  • 如果在已知有8种可能结果情况下,就能通过 l o g 2 8 log_2{8} log28来得知 一共抛了3次硬币
  • 这里3就是熵的大小,即不确定性的大小

在这里插入图片描述

将右侧 A , B , C A, B, C A,B,C这三种非等概率的情况拆解成等概率,去对标等概率的情况

  • 现在依旧有 6 6 6种情况,即 l o g 2 6 log_2{6} log26,前三种实际是一种情况,即 A A A,则 l o g 2 6 − l o g 2 3 log_2{6}-log_2{3} log26log23
  • 同理 B B B l o g 2 6 − l o g 2 2 log_2{6}-log_2{2} log26
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值