熵和条件熵

1、问题描述

在读李航的《统计机器学习》第六章最大熵模型时看到一个矛盾的地方:
关于熵的描述:

H ( P ) = − ∑ i n P ( x i ) l o g P ( x i ) H(P)=-\sum_{i}^{n}P(x_i)logP(x_i) H(P)=inP(xi)logP(xi)

而定义在条件概率分布 P ( Y ∣ X ) P(Y|X) P(YX)上的条件熵又写为:

H ( P ) = − ∑ x , y P ~ ( x ) P ( y ∣ x ) l o g P ( y ∣ x ) H(P)=-\sum_{x,y}\tilde{P}(x)P(y|x)logP(y|x) H(P)=x,yP~(x)P(yx)logP(yx)

但是按照我的理解应该写为:

H ( P ) = − ∑ x , y P ( y ∣ x ) l o g P ( y ∣ x ) H(P)=-\sum_{x,y}P(y|x)logP(y|x) H(P)=x,yP(yx)logP(yx)

感觉书本上的公式多了个 P ~ ( x ) \tilde{P}(x) P~(x)项。查阅资料发现我还是太浅薄了哈哈 数学不行,没有真正理解 H ( P ) H(P) H(P)的含义。

2、公式推导

条件熵 H ( Y ∣ X ) H(Y|X) H(YX)表示在已知随机变量 X X X的条件下随机变量 Y Y Y的不确定性。条件熵 H ( Y ∣ X ) H(Y|X) H(YX)定义为 X X X给定条件下 Y Y Y的条件概率分布的熵对 X X X的数学期望:

H ( Y ∣ X ) = ∑ x p ( x ) H ( Y ∣ X = x ) = − ∑ x p ( x ) ∑ y p ( y ∣ x ) l o g p ( y ∣ x ) = − ∑ x ∑ y p ( x ) p ( y ∣ x ) l o g p ( y ∣ x ) = − ∑ x , y p ( x ) p ( y ∣ x ) l o g p ( y ∣ x ) = − ∑ x , y p ( x , y ) l o g p ( y ∣ x ) H(Y|X)=\sum_{x}p(x)H(Y|X=x) \\=-\sum_{x}p(x)\sum_{y}p(y|x)logp(y|x) \\=-\sum_{x}\sum_{y}p(x)p(y|x)logp(y|x) \\=-\sum_{x,y}p(x)p(y|x)logp(y|x) \\=-\sum_{x,y}p(x,y)logp(y|x) H(YX)=xp(x)H(YX=x)=xp(x)yp(yx)logp(yx)=xyp(x)p(yx)logp(yx)=x,yp(x)p(yx)logp(yx)=x,yp(x,y)logp(yx)

其实化简到倒数第二步已经和书本上一样了,最后一步是因为 p ( y ∣ x ) p ( x ) = p ( x , y ) p(y|x)p(x)=p(x,y) p(yx)p(x)=p(x,y).
重要的是要理解 H ( Y ∣ X ) = ∑ x p ( x ) H ( Y ∣ X = x ) H(Y|X)=\sum_{x}p(x)H(Y|X=x) H(YX)=xp(x)H(YX=x)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值