奇偶校验与海明码原理详解

硬件实现方便：在串行通信（如UART）中，数据是一位一位地依次传输的。先传输数据位，最后传输校验位，接收方可以在接收过程中实时计算“1”的个数，并在收到校验位后立即进行校验，电路设计非常简单。
约定俗成：绝大多数通信协议和系统（如异步串行通信）都将校验位规定在数据帧的末尾。这使得不同设备之间的互联有了统一的标准。
逻辑清晰：将原始数据作为一个整体，在其后追加校验位，在编程计算时也非常直观。

需要注意得是，从纯数学角度看，校验位可以放在任何位置（最高位、最低位、甚至中间），只要发送和接收双方事先约定好即可。因为奇偶校验只关心“1”的总个数，而不关心“1”出现的位置。但是，放在数据位的最高位（MSB - Most Significant Bit）之前是极其罕见的，因为这可能会被误解为数据本身的一部分，从而改变数据的值（尤其是数值型数据）。因此，附加在最低位之后是唯一通用且合理的做法。

详细步骤与举例说明

我们通过一个完整的例子来演示奇偶校验的发送方计算和接收方验证过程。

假设场景：

我们要传输的原始数据：1010001 (7位数据)
双方约定使用偶校验 (Even Parity)

步骤一：发送方计算并附加校验位

计算数据位中“1”的个数：
- 数据 1 0 1 0 0 0 1
- “1”的个数 = 3 (这是一个奇数)
根据校验规则确定校验位的值：
- 规则是偶校验，要求最终“1”的总数为偶数。
- 当前数据位“1”的个数是3（奇），所以我们需要添加一个校验位 1，使总数变成 3 + 1 = 4（偶数）。
- *(如果采用奇校验，当前是3（奇），则校验位应为 0，使总数保持奇数 3+0=3)*
形成最终发送的帧：
- 将校验位附加在原始数据的末尾（最低位之后）。
- 最终发送的数据帧为：1 0 1 0 0 0 1 1 (数据位 + 校验位)

步骤二：接收方验证过程

情况一：传输无错误

接收方收到了发送方发来的完整帧：1010001 1

计算所有位中“1”的个数（包括数据位和校验位）：
1 + 0 + 1 + 0 + 0 + 0 + 1 + 1 = 4
判断奇偶性：
4 是偶数。
得出结论：
符合约定的偶校验规则，认为数据传输正确。

情况二：传输发生单比特错误

假设在传输过程中，第3位（从左往右数）由 1 变成了 0。接收方收到：1 0 **0** 0 0 0 1 1

计算所有位中“1”的个数：
1 + 0 + 0 + 0 + 0 + 0 + 1 + 1 = 3
判断奇偶性：
3 是奇数。
得出结论：
不符合约定的偶校验规则，认为数据传输过程中发生了错误。

情况三：传输发生双比特错误（奇偶校验的盲点）

假设在传输过程中，第3位和第6位同时出错（1->0, 0->1）。接收方收到：1 0 **0** 0 0 **1** 1 1

计算所有位中“1”的个数：
1 + 0 + 0 + 0 + 0 + 1 + 1 + 1 = 4 (错误位一减一增，总数不变)
判断奇偶性：
4 是偶数。
得出结论：
符合偶校验规则，错误无法被检测出来。这就是奇偶校验无法检测偶数个比特错误的原因。

总结

特性	说明
功能	检错（只能检测奇数个比特的错误）
校验位位置	几乎总是附加在原始数据的末尾（最低位之后）
优点	原理简单，实现成本极低，只需1位冗余开销
缺点	1. 只能检错，不能纠错（不知道错误位置） 2. 无法检测偶数个比特的错误
应用	对可靠性要求不高的场景，如： - 一些低速串行通信（UART） - 简单芯片之间的数据交换

海明码

海明码是一种纠错码（Error-Correcting Code, ECC），它不仅能检测错误，还能推导出错误的位置，并还原出发送方实际想要发送的信息，实现纠错。

核心思想

海明码的核心思想是多重奇偶校验。它将多个奇偶校验位巧妙地插入到数据位的不同位置，每个校验位负责校验一组特定的数据位。当错误发生时，通过检查这些校验位的结果，可以直接定位到出错比特的位置。

海明码基本原理

一个非常经典的海明码是(7,4)海明码，(即该海明码共有7个比特位，7个比特位由4个比特的数据位，3个比特的校验位组成)。7个比特的海明码用H7H6H5H4H3H2H1表示，4个比特的数据位用D4D3D2D1表示，3个比特的校验位用P3P2P1表示。接下来以一位出错的情况，来讲解海明码的基本原理，帮助理解记忆其中涉及到的公式。