信息论与编码笔记

最新推荐文章于 2024-06-06 14:56:46 发布

砖头23333

最新推荐文章于 2024-06-06 14:56:46 发布

阅读量1.1w

点赞数 19

分类专栏：笔记文章标签：信息论与编码笔记

本文链接：https://blog.csdn.net/qq_28863845/article/details/82502484

版权

笔记专栏收录该内容

18 篇文章 0 订阅

订阅专栏

信息论与编码

统计信息的概念

香农信息是事物运动状态或存在方式的不确定性的描述

把消息变成适合信道传输的物理量，这种物理量就称为信号

通信的目的：实现信息的保真传输

DMS（Discrete memoryless source）离散无记忆信源

自信息（self information）表示信息量的大小

自信息与事件不确定性相关

I (a i) = - log p (a i)

$I(a_i) = -\log p(a_i)$

log2 :bit

loge :nat

log10 :hart

联合自信息

I (x y) = - log p (x y)

$I(xy) = -\log p(xy)$

条件自信息

I (x | y) = - log p (x | y)

$I(x|y) = -\log p(x|y)$

离散信源

1.信源的数学模型与分类

概率空间(离散信源)：

[X P (x)]

$\begin{bmatrix} X \\ P(x) \end{bmatrix}$

X为样本空间，P(x)为概率函数，P(x)和为1，P大写

离散信源分为离散无记忆信源（DMS）和离散有记忆信源

离散无记忆信源（DMS）：一维概率分布

离散有记忆信源：N维概率分布

概率空间(连续信源)：

[X p (x)]

$\begin{bmatrix} X \\ p(x) \end{bmatrix}$

X为样本空间，p(x)为概率函数，p(x)积分为1，p小写

连续信源分为时间离散的连续源和随机波形源

随机波形源可以通过采样变成时间离散的连续源

2.信息熵

信源X的信息熵：信源输出各消息的自信息量I(ai)的数学期望

含义：

（A）熵值大小表示平均不确定性大小

（B）平均每个信源符号所携带的信息量

单位：bit/sig,nat/sig,hart/sig

H (X) = E (I (a i)) = - \sum P (a i) log P (a i)

$H(X) = E(I(a_i)) = -∑P(a_i) \log P(a_i)$

对于某给定信源，信息熵H(X)的取值是固定的

3.联合熵与条件熵

定义：联合集XY上，联合自信息的平均值定义为联合熵，即：

H (X Y) = E [I (a i b j)] = - \sum \sum P (a i b j) log P (a i b j)

$H(XY) = E[I(a_ib_j)] = -∑∑P(a_ib_j) \log P(a_ib_j)$

N次扩展信源的数学模型

H (X N) = - \sum P (x N i) log P (x N i) = N H (X)

$H(X^N) = -∑P(x_i^N) \log P(x_i^N) = NH(X)$

定义：联合集XY上，条件自信息的平均值定义为条件熵，即：

H (X | Y) = E [I (a i | b j)] = - \sum \sum P (a i b j) log P (a i | b j)

$H(X|Y) = E[I(a_i|b_j)] = -∑∑P(a_ib_j) \log P(a_i|b_j)$

二维平稳信源熵

H (X 2 | X 1) = - \sum P (a i) \sum P (a j | a i) log P (a j | a i)

$H(X_2|X_1) = -∑P(a_i)∑P(a_j|a_i) \log P(a_j|a_i)$

4.熵的基本性质

1.熵的链式法则

H (X Y) = H (X) + H (Y | X)

$H(XY) = H(X) + H(Y|X)$

若X和Y统计独立，则

H (X Y) = H (X) + H (Y)

$H(XY) = H(X) + H(Y)$

N维联合信源熵的链式法则为

H (X 1, X 2, \dots, X n) = \sum H (X i | X i - 1, \dots, X 1)

$H(X_1,X_2,…,X_n) = ∑H(X_i|X_{i-1},…,X_1)$

2.非负性、确定性（确知信源熵为0）、对称性（熵只与随机变量的总体结构有关）、扩展性（极小概率事件对熵几乎无影响）

H (X) \geq 0

$H(X) \geq 0$

3.极值性

H (X 1, X 2, \dots, X n) \leq log q

$H(X_1,X_2,…,X_n) \leq \log q$

当且仅当P(X1) = P(X2) = … = P(Xn) = 1/q，取等号

4.熵的独立界

H (X 1, X 2, \dots, X n) \leq \sum H (X i)

$H(X_1,X_2,…,X_n) \leq ∑H(X_i)$

H (X | Y) \leq H (X)

$H(X|Y) \leq H(X)$

当且仅当X与Y相互独立时等号成立

5.信源的相关性和剩余度

信源剩余度定义：

设某q元信源的极限熵H∞（实际熵），则定义：

r = 1 - H \infty H 0 = 1 - H \infty log q

$r = 1 - \frac{H_∞}{H_0} = 1 - \frac{H_∞}{\log q}$

信源实际熵H∞与理想熵H0相差越大，信源的剩余度就越大，信源的效率也越低

关于信源剩余度的思考：

1.为提高信息传输效率，总希望减少剩余度

提高信源输出信息的效率：信源压缩

2.为提高信息传输可靠性，需要一定的剩余度

提高信息传输可靠性：信道编码

数据压缩的基本路径：从H∞到H0，从信源有记忆到信源无记忆，符号相关性减弱

预测编码：根据某种模型，利用以前的一个或几个样值，对当前的样本值进行预测，将样本实际值和预测值之差进行编码

结论1：
有记忆信源的冗余度寓于信源符号间的相关性中。去除它们之间的相关性，使之成为或几乎成为不相关的信源，其熵将增大

结论2：
离散无记忆信源的冗余度寓于符号概率的非均匀分布中。改变原来信源的概率分布，是指成为或接近等概率分布的信源，其熵将增大

6.离散信道

1.信道模型三要素

输入->信道->输出

[X P (x)] \to P (y | x) \to [Y P (y)]

$\begin{bmatrix} X \\ P(x) \end{bmatrix} \rightarrow P(y|x) \rightarrow \begin{bmatrix} Y \\ P(y) \end{bmatrix}$

P(y|x)信道转移概率

BSC：二元对称信道

P = [1 - p p p 1 - p]

$P= \begin{bmatrix} 1-p & p \\ p & 1-p \\ \end{bmatrix}$

BEC：二元删除信道

P = [p 0 1 - p 1 - q 0 q]

$P= \begin{bmatrix} p & 1-p & 0 \\ 0 & 1-q & q \\ \end{bmatrix}$

2.平均互信息

信道疑义度（损失熵）：

H (X | Y) = - \sum \sum P (a i b j) log P (a i | b j)

$H(X|Y) = -∑∑P(a_ib_j) \log P(a_i|b_j)$

含义：收到Y后关于X的尚存的平均不确定性

性质：

0 \leq H (X | Y) \leq H (X)

$0 \leq H(X|Y) \leq H(X)$

平均互信息：

I (X; Y) = H (X) - H (X | Y) = - \sum \sum P (x y) l o g P ( x | y ) P ( x ) = - \sum \sum P (x y) l o g P ( y | x ) P ( y ) = - \sum \sum P (x y) l o g P ( x y ) P ( x ) P ( y )

$I(X;Y) = H(X) - H(X|Y) = -∑∑P(xy)log\frac{P(x|y)}{P(x)} = -∑∑P(xy)log\frac{P(y|x)}{P(y)} = -∑∑P(xy)log\frac{P(xy)}{P(x)P(y)}$

含义：平均从Y获得的关于X的信息量（又称信道的信息传输率R）

互信息：

I (x; y) = l o g P ( x | y ) P ( x )

$I(x;y) = log\frac{P(x|y)}{P(x)}$

xy小写，表示由随机事件y中获得具体关于x的信息，可正可负

关系

I (X; Y) = E X Y | I (x; y) |

$I(X;Y) = E_{XY}|I(x;y)|$

平均互信息的性质

1.非负性

I (X; Y) \geq 0

$I(X;Y) \geq 0$

说明：通过消息的传递可获得信息

当I(X;Y) = 0

全损信道：

H (X) = H (X | Y)

$H(X) = H(X|Y)$

P (a i b j) = P (a i) P (b j); P (b j) = P (b j | a i)

$P(a_ib_j) = P(a_i)P(b_j); P(b_j) = P(b_j|a_i)$

2.极值性

0 \leq I (X; Y) \leq H (X)

$0 \leq I(X;Y) \leq H(X)$

说明：通过传输获得的信息量不大于提供的信息量

当I(X;Y) = H(X)

无损信道：

H (X | Y) = 0

$H(X|Y) = 0$

P (x | y) = 0 或 1

$P(x|y) = 0或1$

3.对称性

I (X; Y) = I (Y; X)

$I(X;Y) = I(Y;X)$

4.凸状性

定理：对于固定信道，平均互信息I(X;Y)是信源概率分布P(x)的 $\bigcap$ 型凸函数

定理：对于固定信源分布，平均互信息I(X;Y)是信道传递概率P(y|x)的 $\bigcup$ 型凸函数

I (X; Y) = \int [P (x), P (y | x)]

$I(X;Y) = \int [P(x),P(y|x)]$

平均互信息与信源和信道相关

7.信道容量

信道容量的定义：
\[
C = ^{\max}{P(x)}{I(X;Y)} = I(X;Y)|{P(x) - P’(x)}
\]

C是给定的信道的最大的信息传输率

最佳输入分布时，I = C

二元对称信道BSC， $C = 1 - H(p)$

I (x; y) = H (w + p - 2 w p) - H (p)

$I(x;y) = H(w +p -2wp) - H(p)$

无噪信道：P(y|x) = 0 或 1，I(X;Y) = H(Y)

C = max H (Y) = log s

$C = \max H(Y) = \log s$

最佳输入：使P(y) = $\frac{1}{s}$ （输出等概）的输入分布

无损信道：P(x|y) = 0 或 1，I(X;Y) = H(X)

C = max H (X) = log r | P (x) = 1 r

$C = \max H(X) = \log r |_{P(x) = \frac{1}{r}}$

r为信道输入符号数目

二元删除信道BEC， $C = max(1-q)H(w) = 1 - q$ ，当w = $\frac{1}{2}$ 时，取最大值

离散对称信道的信道容量

1.对称信道的定义：若一个离散无记忆信道的信道矩阵中，每一行（或列）都是其他行（或列）的同一组元素的不同排列，则称此信道为离散对称信道

强对称信道（均匀信道）定义：若输入符号和输出符号个数相同，等于r，且信道矩阵为：

⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ 1 - p p r - 1 . . . p r - 1 p r - 1 1 - p . . . p r - 1 . . . . . . . . . . . . p r - 1 p r - 1 . . . 1 - p ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥

$\begin{bmatrix} 1-p & \frac{p}{r-1} & ... & \frac{p}{r-1} \\ \frac{p}{r-1} & 1-p & ... & \frac{p}{r-1} \\ ... & ... & ... & ... \\ \frac{p}{r-1} & \frac{p}{r-1} & ... & 1-p \end{bmatrix}$

2.对称信道的性质

噪声熵 $H(Y|X) = H(p'_1...p'_s)$
当P(x)等概率分布时，输出也是等概率分布

平均互信息： $I(X;Y) = H(Y) - H(Y|X) = H(Y) - H(p'_1...p'_s)$

信道容量： $C = maxI(X;Y) = maxH(Y) - H(p'_1...p'_s) = logs - H(p'_1...p'_s)$

最佳输入： $p(x) = \frac{1}{r}$

并非所有信道，有p(y)等概

对均匀信道

$C = \log r - H(1-p,\frac{p}{r-1},...,\frac{p}{r-1}) = \log r - p \log (r-1) -H(p)$

8.对称密钥密码

加密解密算法公开
$k_e = k_d$ （或相互容易推出）
加密算法足够安全，仅依靠密文不可能译出明文
安全性依赖于密钥的安全性，而不是算法安全性
算法符号描述： $E_k(M) = C,D_k(C) = M$

实现的要求：

Diffusion（弥散）：密文没有统计特征，明文一位影响密文的多位，密钥的一位影响密文的多位
Confusion（混淆）：明文与密文、密钥与密文的依赖关系充分复杂
实现混淆和弥散的基本方法：替代和置换

9.一般离散信道的信道容量

由 $I(x;Y)$ 求C

一般离散信道的平均互信息I(X;Y)达到极大值（即等于信道容量）的充要条件是输入概率分布 ${P_i}$ 满足：

(a) $I(x_i;Y) = C 对所有x_i其P_i \neq 0$

(b) $I(x_i;Y) \leq C 对所有x_i其P_i = 0$

最佳输入不唯一

10.波形信源与波形信道

1.连续性信源的熵

信源X的相对熵（差熵）：

H (X) = - \int b a p (x) log p (x) d x

$H(X) = - \int_a^b p(x) \log p(x) {\rm d}x$

2.相对熵

h (X) = - \int b a p (x) log p (x) d x

$h(X) = - \int_a^b p(x) \log p(x) {\rm d}x$

h (X | Y) = - \iint p (x y) log p (x | y) d x d y

$h(X|Y) = - \iint p(xy) \log p(x|y) {\rm d}x{\rm d}y$

h (X Y) = - \iint p (x y) log p (x y) d x d y

$h(XY) = - \iint p(xy) \log p(xy) {\rm d}x{\rm d}y$

3.连续性信源熵的性质

(a)链式法则和独立界

h (X Y) = h (X) + h (Y | X) = h (Y) + h (X | Y)

$h(XY) = h(X) + h(Y|X) = h(Y) + h(X|Y)$

当X、Y独立时，h(XY) = h(X) + h(Y)

h (X | Y) \leq h (X), h (Y | X) \leq h (Y), h (X Y) \leq h (X) + h (Y)

$h(X|Y) \leq h(X) , h(Y|X) \leq h(Y) , h(XY) \leq h(X) + h(Y)$

(b)可为负

连续信源 $x \in [a,b]$ 均匀分布，熵为：

h (X) = \int b a 1 b - a log (b - a) d x = log (b - a)

$h(X) = \int_a^b \frac{1}{b-a} \log (b-a) {\rm d}x = \log (b-a)$

若b-a<1 ,则h(X) < 0

(c)变换性

坐标变换为线性变换，即： $y_i = \sum b_{ij}x_j$ ，则 $\mid J\mid$ = $\mid\mid b_{ij} \mid\mid$ ，
有： $h(Y) = h(X) + \log \mid\mid b_{ij}\mid\mid$

(d)凸状性

h(X)为p(x)的上凸函数，对某种p(x)的分布，h(X)可达到最大值

砖头23333

关注

19
点赞
踩
140

收藏

觉得还不错? 一键收藏
2
评论
信息论与编码笔记

信息论与编码统计信息的概念香农信息是事物运动状态或存在方式的不确定性的描述把消息变成适合信道传输的物理量，这种物理量就称为信号通信的目的：实现信息的保真传输DMS（Discrete memoryless source）离散无记忆信源自信息（self information）表示信息量的大小自信息与事件不确定性相关I(ai)=−logp(ai)I(ai)=...
复制链接

扫一扫