点对点通信的信道容量定理及其证明

信通天使

已于 2023-12-22 17:01:32 修改

阅读量270

点赞数

分类专栏：信息论文章标签：概率论信息与通信

于 2023-07-23 13:13:57 首次发布

本文链接：https://blog.csdn.net/qq_43602554/article/details/131763925

版权

信息论专栏收录该内容

7 篇文章 1 订阅

订阅专栏

文章详细介绍了点对点通信的数学模型，阐述了香农的信道容量定理，并提供了数学证明。通过随机码本生成方法讨论了编码的可达性，分析了条件差错概率和平均差错概率，证明当编码速率小于信道容量时，平均差错概率趋近于零。此外，还讨论了Fanos不等式和数据处理不等式在证明过程中的应用。

摘要由CSDN通过智能技术生成

文章目录

点对点通信

点对点通信

数学模型

发送端发送消息 $M$ ，首先通过编码器，将消息M用编码序列 $X^n$ 表示， $X^n$ 进入信道传输，接收端接收到信号 $Y^n$ ，通过译码器得到对消息 $M$ 的估计 $\hat M$ 。

首先考虑离散无记忆信道 $p (y ∣ x)$ ，通信模型如下图所示：

点对点通信系统

信道容量定理

香农提出，离散无记忆信道 $p (y ∣ x)$ 的容量：
$\underset{p(x)}{\max} I(X;Y)$

数学证明

编码序列的长度为n，每个位置携带 $R$ bits的信息，有 $2^R$ 种可能，所以长度为n的序列有 $2^{nR}$ 种可能，可以对应 $2^{nR}$ 种消息，也即是消息的个数。

可达性证明

要证明信道容量定理的可达性，即是要证明对于任意的 $\underset{p(x)}{\max}I(X;Y)$ ，都存在一个编码序列 $2^{nR},n)$ ，使得当 $\rightarrow \infty$ 时，平均差错概率 $P_e^{(n)}$ 趋向于0。

随机码本生成

encoder和decoder均已知码本

$X$ 的概率质量函数为 $p (x)$ 。随机独立的生成 $2^{nR}$ 个，长度为n的序列 $x^n(m)$ ， $\in [1:2^{nR}]$ （ $m$ 类似一个标号，用以代表从第一个到第 $2^{nR}$ 个序列）。每一个 $x^n$ 的概率为 $p(x^n) = \prod\limits_{i=1}\limits^np_X(x_i)$ ，生成的所有序列构成一个码本 $C$ ：

$\prod\limits_{m=1}\limits^{2^{nR}} \prod\limits_{i=1}\limits^n p_X(x_i(m))$ $p (C) = 1, C$ 是由码字 $x^n(1),x^n(2),...,x^n(2^{\lceil{nR}\rceil})$ 组成的码本集合

发送端发送信号 $x^n(m)$ ，接收端收到信号 $y^n$ ，如果存在唯一的消息 $\hat m$ ，使得 $(x^n(\hat m),y^n) \in \Tau_{\varepsilon}^{(n)}$ ， $\Tau_{\varepsilon}^{(n)}$ (联合典型集)，则判定发送端发送的消息是第 $\hat m$ 个序列；否则，如果没有这样一个消息 $\hat m$ 或者有多个这样的消息，满足条件 $(x^n(\hat m),y^n) \in \Tau_{\varepsilon}^{(n)}$ ，则判定一个error e已经发生。

假设消息 $M$ 是均匀分布， $\sim Unif[1:2^{nR}]$ 。

条件差错概率

在已知发送的是第 $m$ 个消息序列的条件下，译码器估计的结果并不是第 $m$ 个消息序列的概率，称为条件差错概率，记为 $\lambda_m(C)$ 。
$\lambda_m(C) = P(\hat M \neq m | M = m)$

平均差错概率

基于码本 $C$ 的平均差错概率，定义如下：
$P_e^{n}(C) = P(\hat M \neq M) = \frac{1}{2^{\lceil{nR}\rceil}}\sum\limits_{m=1}\limits^{2^{\lceil{nR}\rceil}} \lambda_m(C)$
若存在一个码本 $C$ $2^{nR},n)$ ，有：
$\underset{n\rightarrow\infty}{lim}P_e^{(n)}(C) = 0$ 则称速率R是可达的。

差错概率分析

为了后续证明方便，不妨假设 $n R$ 是整数(不是整数的时候向上取整即可，只是换个符号 $2^{\lceil{nR}\rceil}$ 而已，道理是一样的)。

假设发送端发送的是第 $m$ 个消息序列，出现以下情况1 or 2：

$(x^n(m),y^n) \notin \Tau_{\varepsilon}^{(n)}$
存在 $m^{\prime} \neq m, (x^n(m^{\prime}),y^n) \in \Tau_{\varepsilon}^{(n)}$

则判定译码发生error，关于码本 $C$ 和消息 $M$ 的平均差错概率为：

$P(\mathcal{E}) = E_C(P_e^{(n)})$ $=E_C(\frac{1}{2^{nR}}\sum\limits_{m=1}\limits^{2^{nR}}\lambda_m(C))$ $=\frac{1}{2^{nR}}\sum\limits_{m=1}\limits^{2^{nR}}E_C(\lambda_m(C))$ $=E_C(\lambda_1(C))$ $=P(\mathcal{E}|M=1)$

因为 $M$ 满足均匀分布，所以每个消息序列出现的概率均为 $\frac{1}{2^{nR}}$ 。根据随机码本生成的对称性，对于任一 $m\in [1:2^{nR}]$ ，其对应的 $\lambda_ m(C)$ 均相同。

下面的说明建立在发送端发送的消息为 $M = 1$ ：

当且仅当出现下面情况中的其中一项或者都出现的时候，判定译码器出错：
$\mathcal{E}_1 = (X^n(1),Y^n) \notin \Tau_\varepsilon^{(n)}$ $\mathcal{E}_2 = (X^n(m),Y^n) \in \Tau_\varepsilon^{(n)} , {m \neq 1}$
平均差错概率：
$P(\mathcal{E}) = P(\mathcal{E}_1 \cup \mathcal{E}_2) \leq P(\mathcal{E}_1)+P(\mathcal{E}_2)$ 对于第一项，根据大数定理，当 $\rightarrow \infty$ 时， $P(\mathcal{E}_1) \rightarrow 0$ 。

对于第二项：

因为 $m\neq1$ ，有：
$(X^n(m),X^n(1),Y^n)\sim \prod\limits_{i=1}\limits^n P_X(x_i(m))P_{X,Y}(x_i(1),y_i)$ $(X^n(m),Y^n) \sim \prod\limits_{i=1}\limits^n P_X(x_i(m))P_Y(y_i)$

联合典型列：

由联合典型性引理的扩展可得：
$P((X^n(m),Y^n)\in \Tau_\varepsilon^{(n)}) \leq 2^{-n(I(X,Y)-\delta(\epsilon))} = 2^{-n(C-\delta(\epsilon))}$ 则有下式成立：
$\mathrm{P}\left(\mathcal{E}_2\right) \leq \sum_{m=2}^{2^{n R}} \mathrm{P}\left\{\left(X^n(m), Y^n\right) \in \mathcal{T}_\epsilon^{(n)}\right\} \leq \sum_{m=2}^{2^{n R}} 2^{-n(C-\delta(\epsilon))} \leq 2^{-n(C-R-\delta(\epsilon))}$ 当n趋向于无穷，对于 $R < C$ ，令 $\epsilon \rightarrow 0$ 时，则有 $\delta(\epsilon) \rightarrow 0$ ，则有 $R<C-\delta(\epsilon)$ ， $2^{-n(C-R-\delta(\epsilon))} \rightarrow 0$

即是， $\mathrm{P}\left(\mathcal{E}_2\right) \rightarrow 0$

那么，对于任意 $R < C$ ，有平均差错概率 $P(\mathcal{E}) \rightarrow 0$ ，也即是信道容量定理的可达性得到证明。

可逆性证明

对于每一个，当 $\rightarrow \infty$ ，平均差错概率 $P_e^{(n)}$ 趋向于0的编码序列 $2^{nR},n)$ ，速率一定满足 $\leq C=\underset{p(x)}{\max}I(X;Y)$ 。

$M,X^n,Y^n)$ 的概率质量函数： $p\left(m, x^n, y^n\right)=2^{-n R} p\left(x^n \mid m\right) \prod_{i=1}^n p_{Y \mid X}\left(y_i \mid x_i\right)$

Fano’s inequality

若 $(X,Y)\sim p(x,y)$ and $P_e = P(X \neq Y)$ ，有下式成立：
$\mid Y) \leq H\left(P_e\right)+P_e \log |\mathcal{X}| \leq 1+P_e \log |\mathcal{X}|$ $|\mathcal{X}|$ 集合 $\mathcal{X}$ 的元素个数， $x\in \mathcal X$ ， $\mathcal X$ 变量 $X$ 的取值集合

根据Fano’s inequality，有下式成立：
$\mid \hat{M}) \leq 1+P_e^{(n)} n R=n \epsilon_n$ $\epsilon_n = (\frac{1}{n} + P_e^{(n)} R)$ ，因为 $\underset{n\rightarrow \infty}\lim P_e^{(n)} = 0$ ，所以当 $\rightarrow \infty$ ，有 $\epsilon_n \rightarrow 0$

data processing inequality

若 $\rightarrow Y \rightarrow Z$ ，有下式成立：
$I(X;Z)\leq I(X;Y)$ 证明： $\begin{aligned} I(X ; Y, Z) & =I(X ; Y)+I(X ; Z \mid Y)=I(X ; Y) \\ & =I(X ; Z)+I(X ; Y \mid Z) \geq I(X ; Z) \end{aligned}$

根据data processing inequality，有下式成立：
$H\left(M \mid Y^n\right) \leq H(M \mid \hat{M}) \leq n \epsilon_n$ 补充： $\rightarrow Y^n \rightarrow \hat M$ 形成一个马尔科夫链，有 $I(M;\hat M)\leq I(M;Y^n)$ $-I(M;\hat M)\geq -I(M;Y^n)$ $H(M)-I(M;\hat M)\geq H(M)-I(M;Y^n)$ $H(M|\hat{M}) \geq H(M|Y^n)$
可逆性证明：
$n R = H (M)$ $\sum\limits_{i=1}\limits^{2^{nR}}p(m_i)logp(m_i ) = -2^{nR}\frac{1}{2^{nR}}log{\frac{1}{2^{nR}}} = -(-nR) = nR$ 推导：
$nR = H(M) =I(M;Y^n) + H(M|Y^n)$ $\leq I(M;Y^n) + n\epsilon_n = \sum_{i=1}^n I(M ; Y_i \mid Y^{i-1})+n \epsilon_n$ $\leq \sum_{i=1}^n I\left(M, Y^{i-1} ; Y_i\right)+n \epsilon_n \stackrel{(b)}{=} \sum_{i=1}^n I\left(X_i, M, Y^{i-1} ; Y_i\right)+n \epsilon_n$ (b)因为 $X_i$ 是 $M$ 的函数 $\stackrel{(c)}{=} \sum_{i=1}^n I\left(X_i ; Y_i\right)+n \epsilon_n$ $(c)$ 因为信道是无记忆的， $(M,Y^{i-1}) \rightarrow X_i \rightarrow Y_i$ 形成一个马尔可夫链
$\leq n C+n \epsilon_n$ 得 $\leq C + \epsilon_n$ 当 $\rightarrow \infty$ 时， $\epsilon_n \rightarrow 0$ ，所以可得 $\rightarrow \infty$ 时， $R\leq C$ ，可逆性得证。