信息论笔记整理（一）

巴川笑笑生

于 2020-05-19 17:04:18 发布

阅读量487

点赞数 1

分类专栏：信息论笔记整理

欢迎访问我的个人主页巴川笑笑生|记录点滴

本文链接：https://blog.csdn.net/qq_16024557/article/details/106217467

版权

信息论笔记整理专栏收录该内容

6 篇文章 3 订阅

订阅专栏

信息论研究问题

信源编码
数据压缩极限
信道编码
信道容量极限

主要以香农理论为主

信息

消除不确定性

信息度量

不确定性消除程度
不确定的程度于事件概率相关
（信息量是概率的单调递减函数）

自信息量

$I (x) = - l o g (p (x))$
其中
$p(x_{i})>p(x_{j})\rightarrow I(x_{i})<I(x_{j})\\I(0)=∞\\I(1)=0$
对统计独立事件
$I(x_{i},x_{j})=I(x_{i})+I(x_{j})$
对数的底为

2 量纲为bit
e 量纲为nat

熵

$H(X)=-\sum p(x)log(p(x))$
是平均不确定性，平均信息量
$H (X) = E (I (X))$
规定
$0 l o g 0 = 0$
零概率事件不影响熵

熵的性质

非负
当事件确定，熵为0
事件给定，熵为定值
离散熵有限
仅依赖于概率分布

伯努利分布的熵

在这里插入图片描述

联合熵

$H(X,Y)=-\sum \sum p(x,y)log(p(x,y))\\=-E(log(p(X,Y)))$

条件熵

$H(Y|X)=\sum p(x)H(Y|X=x)\\=-\sum \sum p(x,y)logp(y|x)\\ =-E(log(p(Y|X)))$

熵的链式法则

$H (X, Y) = H (X) + H (Y ∣ X)$
当X，Y统计独立
$H (X, Y) = H (X) + H (Y)$

相对熵

$D(p||q)=\sum p(x)log\frac {p(x)}{q(x)}\\ =E_{p}log\frac {p(X)}{q(X)}$
约定 $0log\frac {0}{0}=0;0log\frac {0}{q}=0;plog\frac {p}{0}=0$

相对熵性质

非负
当且仅当 $p = q$ 相对熵为0
若有 $p (x) > 0, q (x) = 0$ 则有 $D (p ∣ ∣ q) = \infty$
不是真正的距离

互信息

$I(X;Y)=\sum \sum p(x,y)log\frac {p(x,y)}{p(x)q(y)}\\ =D(p(x,y)||p(x)q(y))\\ =E_{p(x,y)}log\frac {p(X,Y)}{p(X)p(Y)}$
表示给定一个随机变量对另一个随机变量不确定度造成的缩减量
推论
$I (X; Y) = H (X) - H (X ∣ Y)$

凸函数

$f(λx_{1}+(1-λ)x_{2})\leqslant λf(x_{1})+(1-λ)f(x_{2})$
例如 $f (x) = x l o g (x)$

凹函数

$f(λx_{1}+(1-λ)x_{2})\geqslant λf(x_{1})+(1-λ)f(x_{2})$
例如 $f (x) = l o g (x)$

Jensen不等式

$f (X)$ 凸函数，有
$Ef(X)\geqslant f(EX)$

熵的其他性质

极值性
$H(X)\leq log|\chi |$
条件使熵减少
$H(X|Y)\leq H(X)$
独立界
$H(X_{1},...,X_{n})\leq \sum H(X_{i})$

马尔可夫链

$p (x, y, z) = p (x) p (y ∣ x) p (z ∣ y)$

Y给定，X,Z条件独立
X->Y->Z蕴含Z->Y->X

数据处理不等式

若X->Y->Z
有
$I(X;Y)\geq I(X;Z)$
等号成立条件当且仅当 $I (X; Y ∣ Z) = 0$
推论 $I(X;Y|Z)\leq I(X;Y)$

费诺不等式

对于 $X\rightarrow Y\rightarrow \hat{X}$
设 $P_{e}=PrX \neq \hat{X}$
有
$H(P_{e})+P_{e}log|\chi |\geq H(X|\hat{X})\geq H(X|Y)$
弱化为
$1+P_{e}log|\chi |\geq H(X|Y)$