信息熵的概念和例子

强化学习empowerment

信息熵

首先给出信息熵的公式
信息熵公式
信息熵其实表达的是信息的混乱程度。当均匀分布时,信息熵最大。
当熵除一个值之外,其他值均为0,信息熵最小

以世界杯赛为例。大家都很关心谁会是冠军。假如我错过了看世界杯,赛后我问一个知道比赛结果的观众“哪支球队是冠军”? 他不愿意直接告诉我, 而要让我猜,并且我每猜一次,他要收一元钱才肯告诉我是否猜对了,那么我需要付给他多少钱才能知道谁是冠军呢? 我可以把球队编上号,从 1 到 32, 然后提问: “冠军的球队在 1-16 号中吗?” 假如他告诉我猜对了, 我会接着问: “冠军在 1-8 号中吗?” 假如他告诉我猜错了, 我自然知道冠军队在 9-16 中。 这样最多只需要五次, 我就能知道哪支球队是冠军。所以,谁是世界杯冠军这条消息的信息量只值五块钱。
此时可能会发现我们实际上可能不需要猜五次就能猜出谁是冠军,因为象巴西、德国、意大利这样的球队得冠军的可能性比日本、美国、韩国等队大的多。因此,我们第一次猜测时不需要把 32 个球队等分成两个组,而可以把少数几个最可能的球队分成一组,把其它队分成另一组。然后我们猜冠军球队是否在那几只热门队中。我们重复这样的过程,根据夺冠概率对剩下的候选球队分组,直到找到冠军队。这样,我们也许三次或四次就猜出结果。因此,当每个球队夺冠的可能性(概率)不等时,“谁世界杯冠军”的信息量的信息量比五比特少。香农指出,它的准确信息量应该是

− ( p 1 × l o g p 1 + p 2 × l o g p 2 + . . . + p n × l o g p n -(p_{1}×logp_{1}+p_{2}×logp_{2}+...+p_{n}×logp_{n} (p1×logp1+p2×logp2+...+pn×logpn

https://baike.baidu.com/item/%E9%A6%99%E5%86%9C%E7%86%B5/1649961?fr=aladdin
条件熵H(Y|X)表示在已知随机变量X的条件下随机变量Y的不确定性
在这里插入图片描述
用下面的例子来解释
在这里插入图片描述
假如我们有上面数据:

设随机变量Y={嫁,不嫁}

我们可以统计出,嫁的个数为6/12 = 1/2

不嫁的个数为6/12 = 1/2

那么Y的熵,根据熵的公式来算,可以得到** H ( Y ) = − 1 / 2 l o g 1 / 2 − 1 / 2 l o g 1 / 2 H(Y) = -1/2log1/2 -1/2log1/2 H(Y)=1/2log1/21/2log1/2**

为了引出条件熵,我们现在还有一个变量X,代表长相是帅还是不帅,当长相是不帅的时候,统计如下红色所示:

在这里插入图片描述
可以得出,当已知不帅的条件下,满足条件的只有4个数据了,这四个数据中,不嫁的个数为1个,占1/4,嫁的个数为3个,占3/4
那么此时的
H(Y|X = 不帅) = -1/4log1/4 - 3/4log3/4
p(X = 不帅) = 4/12 = 1/3

同理我们可以得到

当已知帅的条件下,满足条件的有8个数据了,这八个数据中,不嫁的个数为5个,占5/8
,嫁的个数为3个,占3/8
那么此时的
H(Y|X = 帅) = -5/8log5/8 - 3/8log3/8
p(X = 帅) = 8/12 = 2/3

计算结果
有了上面的铺垫之后,我们终于可以计算我们的条件熵了,我们现在需要求:

H(Y|X = 长相)

也就是说,我们想要求出当已知长相的条件下的条件熵。

根据公式我们可以知道,长相可以取帅与不帅俩种

条件熵是另一个变量Y熵对X(条件)的期望。

H ( Y ∣ X = 长 相 ) = p ( X = 帅 ) ∗ H ( Y ∣ X = 帅 ) + p ( X = 不 帅 ) ∗ H ( Y ∣ X = 不 帅 ) H(Y|X=长相) = p(X =帅)*H(Y|X=帅)+p(X =不帅)*H(Y|X=不帅) HYX==p(X=)HYX=+p(X=)HYX=

然后将上面已经求得的答案带入即可求出条件熵!
参考文章:https://zhuanlan.zhihu.com/p/26551798

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值