信息论基础——熵

最新推荐文章于 2021-01-05 22:26:45 发布

「已注销」

最新推荐文章于 2021-01-05 22:26:45 发布

阅读量583

点赞数

分类专栏：数学准备

本文链接：https://blog.csdn.net/xu_ampl/article/details/94784748

版权

本文介绍了信息论中的熵，包括Jensen不等式、熵的定义、性质，以及联合熵、条件熵、互信息和相对熵的概念。熵作为衡量随机变量不确定性的度量，其基本性质和相关定理如最大熵原理、信息不等式等被详细阐述。此外，还讨论了互信息与变量独立的关系，以及条件互信息的概念。

摘要由CSDN通过智能技术生成

信息论基础——熵

一、Jensen不等式
定理1 设 $f$ 为区间 $I$ 上的凹函数， $p_{i} \in[0,1], i=1,2,\cdots,n$ ,且 $\sum_{i=1}^{n} p_{i}=1$ ，则对任何 $x_{i} \in I$ ，有 $f\left(\sum_{i=1}^{n} p_{i} x_{i}\right) \geqslant \sum_{i=1}^{n} p_{i} f\left(x_{i}\right)$

若 $f$ 严格凹，上式的等号只有在下列条件满足时才成立：若 $p_{i} \cdot p_{j} \neq 0$ ，则必有 $x_{i}=x_{j}$
证明：略
对于对数函数 $f(x)=\log x$ 在区间 $(0,+\infty)$ 是凹函数，有 $\log \left(\sum_{i=1}^{n} p_{i} x_{i}\right) \geqslant \sum_{i=1}^{n} p_{i} \log x_{i}$ ， $\forall i, x_{i}>0, p_{i} \geqslant 0$ ，且 $\sum_{i=1}^{n} p_{i}=1$ 。

二、熵
一个离散随机变量 $X$ 的熵 $H (X)$ 的定义为 $H(X)=\sum_{X} P(X) \log \frac{1}{P(X)}=-\sum_{X} P(X) \log P(X)$ $\log P(X)$ 以为 $2$ 底，熵的单位是比特，以 $e$ 为底，熵的单位是奈特
熵是对随机变量的不确定性的度量。随机变量 $X$ 的熵越大，说明它的不确定性越大。
熵的基本性质
$(1)$ $\geqslant 0$
$(2)$ $\leqslant \log |X|$ ,等号成立当且仅当对 $X$ 的所有取值 $x$ 有 $P(X=x)=\frac{1}{|X|}$

证明： $(1)$ 对 $X$ 的任意取值 $x$ ，总有 $\log P(X=x) \geqslant 0$
$(2)$ $\begin{aligned} H(X) &=\sum_{x} P(X) \log \frac{1}{P(X)} \\ & \leqslant \log \sum_{X} P(X) \frac{1}{P(X)}=\log |X| \end{aligned}$ 命题得证，此性质经常被称为最大熵原理

三、联合熵、条件熵和互信息
联合熵：两个离散随机变量 $X$ 和 $Y$ 的联合熵的定义为
$Y)=\sum_{X, Y} P(X, Y) \log \frac{1}{P(X, Y)}=-\sum_{X, Y} P(X, Y) \log P(X, Y)$
条件熵：给定 $Y = x$ 时 $X$ 的条件熵为
$Y=y)=\sum_{X} P(X | Y=y) \log \frac{1}{P(X | Y=y)}$
条件熵 $H (X ∣ Y$

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
信息论基础——熵

信息论基础——熵一、Jensen不等式定理1 设fff 为区间III 上的凹函数，pi∈[0,1],i=1,2,⋯&ThinSpace;,np_{i} \in[0,1], i=1,2,\cdots,npi∈[0,1],i=1,2,⋯,n,且∑i=1npi=1\sum_{i=1}^{n} p_{i}=1∑i=1npi=1，则对任何xi∈Ix_{i} \in Ixi∈I，有f...
复制链接

扫一扫

专栏目录