信息熵基础(2)

本文摘抄自《信息论基础-第二版》第二章:熵、相对熵与互信息

2 联合熵与条件熵

现将单个随机变量的熵推广到两个随机变量的情形。由于可将(X,Y)视为单个向量值随机变量,所以定义其实并无新鲜之处。

定义:对于服从联合分布为p(x,y)的一对离散随机变量(X,Y),其联合熵H(X,Y) (joint entropy)定义为:

H(X,Y)=-\sum_{x\in \chi}\sum_{y\in \nu }p(x,y)\log p(x,y)

上式亦可表示为H(X,Y)=-E\log p(X,Y),也可以定义一个随机变量在给定另一随机变量下的条件熵,它是条件分布上关于起条件作用的那个随机变量取平均之后的期望值。

定义:若(X,Y)~p(x,y),条件熵(Conditional entropy) H(Y|X)定义为:

H(Y|X)=\sum_{x\in \chi}p(x)H(Y|X=x)=-\sum_{x\in \chi}p(x)\sum_{y\in \nu }p(y|x)\log p(y|x)

=-\sum_{x\in \chi}\sum_{y\in \nu}p(x,y)\log(y|x)=-E\log p(Y|X)

联合熵和条件熵的定义的这种自然性可由一个事实得到体现,他就是一对随机变量的熵等于其中一个随机变量的熵加上另一个随机变量的条件熵。

定理2.2.1(链式法则)H(X,Y)=H(X)+H(Y|X)

证明:

H(X,Y)=-\sum_{x\in \chi}\sum_{y\in \nu}p(x,y)logp(x,y)=-\sum_{x\in \chi}\sum_{y\in \nu}p(x,y)logp(x)\cdot p(y|x)

=-\sum_{x\in \chi}\sum_{y\in \nu}p(x,y)logp(x)-\sum_{x\in \chi}\sum_{y\in \nu}p(x,y)logp(y|x)

=-\sum_{x\in \chi}p(x)logp(x)-\sum_{x\in \chi}\sum_{y\in \nu}p(x,y)logp(y|x)=H(X)+H(Y|X)

等价的记为:\log p(X,Y)=\log p(X)+\log p(Y|X)。等式两边同时取数学期望,即得本定理。

推论:

H(X,Y|Z)=H(X|Z)+H(Y|X,Z)

 

例2.2.1:设(X,Y)服从如下得联合分布:

Y         X1234Y
11/81/161/321/321/4
21/161/81/321/321/4
31/161/161/161/161/4
41/40001/4
X1/21/41/81/8 

X的遍及分布为(1/2,1/4,1/8,1/8),Y的边际分布为(1/4,1/4,1/4,1/4),因而H(X)=7/4bit,而H(Y)=2bit。并且,

H(X|Y)=\sum_{i=1}^{4}p(Y=i)H(X|Y=i)= -(\frac{1}{4}*H(\frac{1}{2},\frac{1}{4},\frac{1}{8},\frac{1}{8}))- (\frac{1}{4}*H(\frac{1}{4},\frac{1}{2},\frac{1}{8},\frac{1}{8}))- (\frac{1}{4}*H(\frac{1}{4},\frac{1}{4},\frac{1}{4},\frac{1}{4}))- (\frac{1}{4}*H(1,0,0,0))=\frac{11}{8}bits

同理:H(Y|X)=\sum_{i=1}^{4}p(X=i)H(Y|X=i)= -(\frac{1}{2}*H(\frac{1}{4},\frac{1}{8},\frac{1}{8},\frac{1}{2})) - (\frac{1}{4}*H(\frac{1}{4},\frac{1}{2},\frac{1}{4},0)) - (\frac{1}{8}*H(\frac{1}{4},\frac{1}{4},\frac{1}{2},0)) - (\frac{1}{8}*H(\frac{1}{4},\frac{1}{4},\frac{1}{2},0))=\frac{13}{8}bits

可以计算H(X,Y)=\frac{27}{8}

注释H(Y|X)\neq H(X|Y)但是H(X)-H(X|Y)=H(Y)-H(Y|X)

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值