熵、条件熵、互信息等概念

转:http://ziketang.com/2013/08/some-notions-about-entropy/

关于这些概念看过很多次了,但一直都记不住,索性用笔记形式记下来备查吧。

1. 熵Entropy

关于熵的基本概念就不说了,可以认为是用来描述随机变量的不确定性,也可以说是用来描述随机变量平均信息量(信息量用编码长度表示,熵即为编码长度的期望形式)。公式如下:

H(X)=xXp(x)logap(x)

a=2 时,即熵的单位为比特。可以看到,当有必然事件 p(x)=1 发生时,熵值达到最小值0;当所有概率均相等时,熵值达到最大。

 

2. 联合熵Joint Entropy、条件熵Conditional Entropy

X,Y 是两个离散型随机变量,它们的联合分布密度为 p(x,y) ,则 X Y 的联合熵定义为:

H(X,Y)=xX,yYp(x,y)logp(x,y)

条件熵定义为:
H(Y|X)=xXp(x)H(Y|X=x)=xXp(x)yYp(y|x)logp(y|x)=xX,yYp(x,y)logp(y|x)

 

3. 互信息Mutual Information

根据以上的定义,有链式规则:

H(X,Y)=H(X)+H(Y|X)=H(Y)+H(X|Y)

证明如下:
H(X)+H(Y|X)=xXp(x)logp(x)xX,yYp(x,y)logp(y|x)=xX,yYp(x,y)logp(x)xX,yYp(x,y)logp(y|x)=xX,yYp(x,y)logp(x,y)=H(X,Y)

同理交换 X Y 则可证明 H(X,Y)=H(Y)+H(X|Y)
同时,根据链式规则可推导出互信息的定义:
MI(X,Y)=H(X)H(X|Y)=H(Y)H(Y|X)

根据定义,可推导出:
MI(X,Y)=H(X)H(X|Y)=xXp(x)logp(x)+xX,yYp(x,y)logp(x|y)=xX,yYp(x,y)logp(x)+xX,yYp(x,y)logp(x|y)=xX,yYp(x,y)logp(x)p(x|y)=xX,yYp(x,y)logp(x)p(y)p(x,y)=xX,yYp(x,y)logp(x,y)p(x)p(y)

互信息用来描述包含在X中有关Y的信息量,或包含在Y中有关X的信息量,在形式上可理解为在确定了其中的 Y X 的熵值保留。

根据互信息,可以来判定相关性:
– 当 MI(X,Y)>>0 时, X Y 高度相关;
– 当 MI(X,Y)=0 时, X Y 相互独立;
– 当 MI(X,Y)<<0 时, X Y 互补相关。

上面的定义均可以表达在Venn韦恩图中:
entropy

两个集合A,B,其中A代表 H(X) ,B代表 H(Y) ,交集为 MI(X,Y) ,并集为 H(X,Y)

 

4. 交叉熵Cross Entropy

设随机变量 X 的分布密度为 p(x) ,在很多情况下该密度是未知的,通过使用统计手段得到 X 的近似分布 q(x) ,则将随机变量 X 的交叉熵定义为:

H(X,q)=xXp(x)logq(x)

形式上可以理解为使用 q(x) 来代替原来 p(x) 的信息量。

 

5. 相对熵Relative Entropy

p(x) q(x) 是随机变量 X 的两个不同分布密度,则它们的相对熵定义为:

D(p||q)=xXp(x)logp(x)q(x)=xXp(x)logp(x)xXp(x)logq(x)=H(X,q)H(q)

相对熵一般也称为Kullback-Leibler散度或Kullback-Leibler距离,可以用来度量一个随机变量不同分布的差异程度,描述了因为错用分布密度而增加的信息量。

 

参考:

[1] 常宝宝, 熵和语言模型评价, 北京大学计算语言学研究所, http://www.icl.pku.edu.cn/member/chbb/lecture/CL/Computational_Linguistics_04.pdf

 

====更正===

2014-03-29 互信息与相关性的关系错误,该处在参考P11页中应为点互信息。正确的互信息与相关性关系:当相关性为+/-1时,互信息趋于无穷;当相关性为0时,互信息为0。感谢@pbqy网友指正

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值