【卷积码基础】第一章介绍之分组码 Part1

最新推荐文章于 2024-09-26 18:56:14 发布

Barry_You

最新推荐文章于 2024-09-26 18:56:14 发布

阅读量711

点赞数

分类专栏：卷积码基础文章标签：信息与通信

卷积码基础专栏收录该内容

2 篇文章

订阅专栏

文章目录

第一章介绍 Introduction
- 1.2 分组码
- - 1.2.1 Intro
  - 1.2.2 汉明距离

第一章介绍 Introduction

1.2 分组码

1.2.1 Intro

简单起见，仅研究二进制分组码。考虑一整个信息比特序列被分为若干个长度为 $K$ 比特的码块，这些码块被称为消息(messages)，用 $\boldsymbol{u}=u_{0} u_{1} \ldots u_{K-1}$ 来表示。在分组码中，通常用 $\boldsymbol{u}$ 表示一条消息，而不是整个信息比特序列，在卷积码中也一样。

二进制 $(N, K)$ 分组码 $\mathcal{B}$ 是 $M=2^K$ 个二进制 $N$ 元组的集合， $\boldsymbol{v}=v_{0} v_{1} \ldots v_{N-1}$ 称为码字（codewords）， $N$ 称为分组长度。比例
$R=\frac{\log M}{N}=\frac{K}{N}$
称为码率（code rate），单位是bits/channel use。单位为bits/s的数据传输率可以通过码率乘以每秒传输的信道符号数量得到
$R_t=R/T$
如果我们以bits/channel use(bits/c.u.)为单位描述BSC信道的信道容量，可以得到BSC的信道容量为
$C=1-h(\epsilon) \quad \text { (bits/c.u.) }$
根据香农信道编码理论，对于可靠通信，必须有 $R\leq C$ ，同时分组长度 $N$ 应充分大。
A binary symmetric channel (BSC) with (channel) encoder and decoder.
码率 $R = K / N$ 是码字中表示信息所必须的二进制所占的比例，剩余的部分即 $1 - R = (N - K) / N$ 表示冗余度(redundancy)，这些冗余可以帮助检测或纠正错误。

假设对应于消息 $\boldsymbol{u}$ 的码字 $\boldsymbol{v}$ 通过一个BSC信道发送。信道的输出 $\boldsymbol{r}=r_{0} r_{1} \ldots r_{N-1}$ 称为接收序列。译码器将接收到的可能被噪声污染的 $N$ 元组 $\boldsymbol{r}$ 转换成 $K$ 元组 $\widehat{\boldsymbol{u}}$ ，称为对消息 $\boldsymbol{u}$ 的估计。理想情况下， $\widehat{\boldsymbol{u}}$ 应该为 $\boldsymbol{u}$ 的副本，但是信道噪声会引起一些译码错误。由于消息 $\boldsymbol{u}$ 和码字 $\boldsymbol{v}$ 存在一对一的对应关系，因此可以等价地考虑 $N$ 元组 $\widehat{\boldsymbol{v}}$ 作为译码的输出。如果一个码字 $\boldsymbol{v}$ 被传输，那么当且仅当 $\widehat{\boldsymbol{v}}\neq \boldsymbol{v}$ 时发生了译码错误。

令 $P_E$ 指代分组错误概率(block or word error probability)，也就是译码输出 $\hat{\boldsymbol{v}}$ 不同于传输码字 $\boldsymbol{v}$ 的概率。有
$P_{\mathrm{E}}=\sum_{\boldsymbol{r}} P(\widehat{\boldsymbol{v}} \neq \boldsymbol{v} \mid \boldsymbol{r}) P(\boldsymbol{r})$
其中，接收到序列 $\boldsymbol{r}$ 的概率 $P(\boldsymbol{r})$ 独立于译码规则，且 $P(\widehat{\boldsymbol{v}} \neq \boldsymbol{v} \mid \boldsymbol{r})$ 是给定接收序列 $\boldsymbol{r}$ 的条件译码错误概率。因此，为了最小化 $P_E$ ，我们应该指定译码器最小化给定接收序列 $\boldsymbol{r}$ 下的条件译码错误概率 $P(\widehat{\boldsymbol{v}} \neq \boldsymbol{v} \mid \boldsymbol{r})$ ，或者等价地，最大化 ${P(\boldsymbol{v} | \boldsymbol{r}) \stackrel{\text { def }}{=}}$ ${P(\widehat{\boldsymbol{v}}=\boldsymbol{v} | \boldsymbol{r})}$ 。因此，当译码器选择 $\widehat{\boldsymbol{u}}$ 使得对应的 $\widehat{\boldsymbol{v}}={\boldsymbol{v}}$ 最大化 ${P(\boldsymbol{v} | \boldsymbol{r})}$ 时，分组错误概率 $P_E$ 被最小化。也就是说， $\boldsymbol{v}$ 是与接收序列 $\boldsymbol{r}$ 最相似的码字。这种译码器称为最大后验概率（maximum a posteriori probability，MAP）译码器。
通过贝叶斯准则，可以写出
$P(\boldsymbol{v} \mid \boldsymbol{r})=\frac{P(\boldsymbol{r} \mid \boldsymbol{v}) P(\boldsymbol{v})}{P(\boldsymbol{r})}$
给定码字的个数，当码字出现的可能性相等时，该编码携带最多的信息。可以合理的假设，当码字出现的可能性不等时，即当传输的信息较少时，为这种情况设计的译码器也能令人满意地工作——尽管不是最佳的。当码字出现的可能性相等时，最大化 $P(\boldsymbol{v} \mid \boldsymbol{r})$ 等价于最大化 $P(\boldsymbol{r} \mid \boldsymbol{v})$ 。这种作出判决 $\widehat{\boldsymbol{v}}={\boldsymbol{v}}$ 使得 $P(\boldsymbol{r} \mid \boldsymbol{v})$ 最大化的译码器叫做最大似然（maximum-likelihood，ML）译码器。

注意，在码字的错误判决中，一些信息比特位仍然可能是正确的。在大多数应用中，比特错误概率是衡量编码好坏的更好方法。然而，它通常更难计算。像分组错误概率一样，比特错误概率不仅取决于编码规则和信道，而且还取决于编码器和信息符号。

使用分组错误概率来衡量编码的好坏是合理的，因为有以下不等式 $P_b \leq P_E$
这个不等式意味着当 $P_E$ 足够小的时候， $P_b$ 也足够小。

1.2.2 汉明距离

两个 $N$ 元组 $\boldsymbol{r}$ 和 $\boldsymbol{v}$ 之间的汉明距离(Hamming Distance)是指它们对应位置不同的元素个数，表示为 $d_H(\boldsymbol{r},\boldsymbol{v})$ 。汉明距离是编码理论中重要的一个概念，它有以下性质：

$d_{\mathrm{H}}(\boldsymbol{x}, \boldsymbol{y}) \geq 0$ 当且仅当 $\boldsymbol{x}=\boldsymbol{y}$ 时取等号。（正定性）
$d_{\mathrm{H}}(\boldsymbol{x}, \boldsymbol{y})=d_{\mathrm{H}}(\boldsymbol{y}, \boldsymbol{x})$ （对称性）
对于任意 $\boldsymbol{z}$ ， $d_{\mathrm{H}}(\boldsymbol{x}, \boldsymbol{y}) \leq d_{\mathrm{H}}(\boldsymbol{x}, \boldsymbol{z})+d_{\mathrm{H}}(\boldsymbol{z}, \boldsymbol{y})$ （三角形不等式）

$N$ 元组 $\boldsymbol{x}=x_{0} x_{1} \ldots x_{N-1}$ 的**汉明重量(Hamming Weight)**是指 $\boldsymbol{x}$ 中非零元素的个数，表示为 $w_{\mathrm{H}}(\boldsymbol{x})$ 。

对于BSC，发送的符号以概率 $\epsilon$ 被错误地接收，其中 $\epsilon$ 也被称为信道交叉概率。因此，假设ML解码，我们必须使码字 $\boldsymbol{v}$ 的判决 $\widehat{\boldsymbol{v}}$ 能够最大化 $P(\boldsymbol{r} \mid \boldsymbol{v})$ ，也就是说，
$\widehat{\boldsymbol{v}}=\arg \max _{\boldsymbol{v}}\{P(\boldsymbol{r} \mid \boldsymbol{v})\}$
其中，
$P(\boldsymbol{r} \mid \boldsymbol{v})=\epsilon^{d_{\mathrm{H}}(\boldsymbol{r}, \boldsymbol{v})}(1-\epsilon)^{N-d_{\mathrm{H}}(\boldsymbol{r}, \boldsymbol{v})}=(1-\epsilon)^{N}\left(\frac{\epsilon}{1-\epsilon}\right)^{d_{\mathrm{H}}(\boldsymbol{r}, \boldsymbol{v})}$
由于对于BSC， $0<\epsilon<1 / 2$ ，有
$0<\frac{\epsilon}{1-\epsilon}<1$
因此，最大化 $P(\boldsymbol{r} \mid \boldsymbol{v})$ 等价于最小化 $d_H(\boldsymbol{r},\boldsymbol{v})$ ，此时ML译码等价于最小（汉明）距离（minimum (Hamming) distance ，MD）译码器。

汉明距离和汉明重量的关系：
在向量空间 $\mathbb{F}_{2}^{N}$ 中，有
$d_{\mathrm{H}}(\boldsymbol{x}, \boldsymbol{y})=w_{\mathrm{H}}(\boldsymbol{x}-\boldsymbol{y})=w_{\mathrm{H}}(\boldsymbol{x}+\boldsymbol{y})$
对于编码 $\mathcal{B}$ 的最小距离 $d_\text{min}$ 被定义为 $d_{\mathrm{H}}\left(\boldsymbol{v}, \boldsymbol{v}^{\prime}\right)$ 的最小值，其中 $\boldsymbol{v}$ 和 $\boldsymbol{v}^{\prime}$ 都在 $\mathcal{B}$ 中且 $\boldsymbol{v}\neq \boldsymbol{v}^{\prime}$ 。