信息论基础--信息量与熵

theaccker

已于 2023-03-15 17:56:07 修改

阅读量1.5k

点赞数 14

分类专栏：笔记文章标签：学习

于 2023-03-15 16:15:26 首次发布

本文链接：https://blog.csdn.net/m0_59977663/article/details/129556122

版权

笔记专栏收录该内容

4 篇文章 0 订阅

订阅专栏

熵是衡量随机变量不确定度的度量。自信息表示事件发生的不确定性和信息量，条件自信息是在已知其他事件发生后对某一事件不确定性的影响。信息熵是所有可能事件自信息的平均值，而条件熵则考虑了在给定条件下事件的不确定性。联合熵描述两个或多个随机变量共同的不确定性。这些概念在数据处理和通信中具有重要应用。

摘要由CSDN通过智能技术生成

文章目录

- - 1. 离散集的平均自信息量----熵
  - - 1.1 What is "Entropy"

1. 离散集的平均自信息量----熵

1.1 What is “Entropy”

熵是随机变量不确定度的度量

在介绍熵的概念前，我们先引入一些前导概念

1.1.1 自信息和条件自信息

如何理解自信息，我们可以从以下几个角度切入

表示事件不确定性的大小
表示事件发生带来的信息量的多少。事件一旦发生，就消除了不确定性，从而带来了信息量。
表示为了确定事情的发生，所需信息量的多少

对于事件集合 $X=\lbrace x_1,x_2,x_3....x_n \rbrace$ ，其中某一事件 $x_i$ 发生的概率为 $p_i$ ，则自信息量的定义为：

$I(x_i)=-\log p_i$

其中 $I(x_i) \geqslant 0$ ，且随 $p_i$ 减小而增大。(底数为2时，自信息的单位是bit)

那什么是条件自信息呢？
倘若事件Y发生后收获的信息会改变事件X的不确定性，则在Y的影响下，此时事件X的不确定性就是其的条件自信息，其表达式如下:

$I(x|y)=-\log p(x|y)$

1.1.2 熵

令 $X$ 表示输入离散事件集合（简称集），其中 $X=\lbrace x_k , k=1,2,...K \rbrace$ ，对应每个事件 $x_k\in X$ ,相应概率为 $Q(x_k)$ ,简记为 $Q_k$ ,且

$\displaystyle\sum^{K}_{k=1}\space Q_k=1$ ,其中 $\space Q_k\geq0,k=1,2,...K$

以 $\lbrace X,Q(x) \rbrace$ 表示输入概率空间。

集 $\lbrace X,Q(x) \rbrace$ 上定义的自信息量 $I (x)$ 的数学期望表示如下:

$H(x)\space\stackrel {\mathrm{def}} {==} \space E[I(x)]=\displaystyle \sum^{}_{x \in X}{Q(x)I(x)}=-\sum Q(x) \space\log Q(x)$

$H (x)$ 称为 集 $X$ 的平均自信息量，又称作是 集 $X$ 的信息熵，简称熵。 其表示了 集 $X$ 中事件出现的平均不确定性，几位了确定 集 $X$ 中出现的一个事件平均所需的信息量（观测之前），或*集 $X$ *中每出现一事件平均给出的信息量（观测之后）。

1.1.3 条件熵

定义在 集 $\lbrace Y,\Omega(y) \rbrace$ 上的随机变量 $H (X ∣ y)$ 的数学期望

$H(X|Y)\space\stackrel {\mathrm{def}} {==} \space E\space[H(X|y)]\space=\space\displaystyle \sum^{}_{x }{\Omega(y)\space H(X|y)}\space\stackrel {\mathrm{def}} {==}\space-\sum ^{}_{x}\sum^{}_{y} P(x,y) \space\log P(x|y)$

称做 集 $X$ 是相对于 集 $Y$ 的条件熵. 当 集 $X$ 和 集 $Y$ 统计独立时，有

$H (X ∣ Y) = H (X)$

1.1.4 联合熵

定义在 集 $\lbrace (X,Y),P(x,y) \rbrace$ 上的随机变量 $I(x,y)=-\log P(x,y)$ 的数学期望

$H(X,Y)\space\stackrel {\mathrm{def}} {==} \space E\space[I(x,y)]\space=\space\displaystyle \sum^{}_{x }{P(x,y)\space I(x,y)}\space\stackrel {\mathrm{def}} {==}\space-\sum ^{}_{x}\sum^{}_{y} P(x,y) \space\log P(x,y)$

称做是集 $X$ 和 集 $Y$ 的联合熵.

然后由

① $P(x,y)=Q(x)P(y|x)=\Omega(y)P(x|y)$
② $H(x)\space\stackrel {\mathrm{def}} {==} \space E[I(x)]=\displaystyle \sum^{}_{x \in X}{Q(x)I(x)}=-\sum Q(x) \space\log Q(x)$
③ $H(X|Y)\space\stackrel {\mathrm{def}} {==} \space E\space[H(X|y)]\space=\space\displaystyle \sum^{}_{x }{\Omega(y)\space H(X|y)}\space\stackrel {\mathrm{def}} {==}\space-\sum ^{}_{x}\sum^{}_{y} P(x,y) \space\log P(x|y)$
④ $H(X,Y)\space\stackrel {\mathrm{def}} {==} \space E\space[I(x,y)]\space=\space\displaystyle \sum^{}_{x }{P(x,y)\space I(x,y)}\space\stackrel {\mathrm{def}} {==}\space-\sum ^{}_{x}\sum^{}_{y} P(x,y) \space\log P(x,y)$

联合推导出
⑤ $H (X, Y) = H (X) + H (X ∣ Y) = H (Y) + H (Y ∣ X)$

式 ⑤ 表述了信息的可加性。当集 $X$ 和 集 $Y$ 统计独立时

$H (X, Y) = H (X) + H (Y)$

theaccker

关注

14
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
信息论基础--信息量与熵

在介绍熵的概念前，我们先引入一些前导概念如何理解自信息，我们可以从以下几个角度切入对于事件集合X={x1,x2,x3....xn}X=\lbrace x_1,x_2,x_3....x_n \rbraceX={x1,x2,x3....xn}，其中某一事件xix_ixi发生的概率为pip_ipi，则自信息量的定义为：其中 I(xi)⩾0I(x_i) \geqslant 0I(xi)⩾0，且随pip_ipi减小而增大。(底数为2时，自信息的单位是bit)那什么是条件自信息呢？倘若事件Y发生后收
复制链接

扫一扫

专栏目录