校验方法综述、奇偶校验、海明纠错、循环冗余校验

最新推荐文章于 2025-05-03 19:12:26 发布

linlinzii

最新推荐文章于 2025-05-03 19:12:26 发布

阅读量645

点赞数 6

CC 4.0 BY-SA版权

分类专栏：计算机组成原理文章标签：网络安全笔记经验分享硬件工程计算机网络

本文链接：https://blog.csdn.net/linlinzii/article/details/134953251

计算机组成原理专栏收录该内容

2 篇文章

订阅专栏

本文围绕信息校验方法展开，先阐述校验方法综述，包括校验原因、编码方式、纠错检错能力影响因素等。接着介绍奇偶校验和海明纠错码，分析海明码组成、公式由来及纠错过程。最后讲解循环冗余校验，涉及生成多项式、运算规则和校验步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在本个内容中我们会进行校验方法综述、奇偶校验、海明纠错、循环冗余校验的相关内容讲解，本文参考于吴迪副教授的资料，浙江大学，华中科技大学课程所著

在进行讲解之前，我们需要了解几个基本概念：

码距，编码集的码距，校验码，SEC，ECC，多重奇偶校验，海明码，生成多项式，异或运算，模 2 运算，CRC 码

一、校验方法综述

1.为什么要对信息进行校验？

受外界电磁环境的影响，可能造成电容的充电和放电以及触发器的翻转，这样，存储的信息就可能出错

2.为了能够校验出信息是否正确，如何进行编码？

理查德·海明（Richard Hamming）发明了一种广泛应用于存储器的冗余技术，并因此获得 1968 年的图灵奖。海明使用奇偶校验码进行错误检测。

3.纠错或检错能力与什么因素有关？

通过本页的例子得到：d-1=e+t。（由《计算机组成原理教材》（谭志虎版本）表 2.17 可以总结得到）

4.校验出信息出错后是如何进行纠错？也就是如何找到出错位。

首先我们给出

【码距】（海明距离）d 的定义：两个编码对应二进制位不同的个数。

比如：10101 和 00110 的码距：d=3.

【编码集的码距】：在一个有效编码集合中，任意两个码字的最小距离。

【校验码】：具有发现错误或者纠正错误能力的数据编码。作用是扩大码距，从而通过编码规则来识别错误代码。

问：如果代码要具有检错、纠错能力，代码应该符合怎样的条件呢？

答：也就是说，哪些代码不在代码集合中，如果出现了，就能确认这些代码是错误的。

一般来说，码距越大，抗干扰能力越强，纠错能力越强；数据冗余越大，编码效率越低。编码的检测能力和纠错能力与什么有关，我们来看看合法代码的集合：

1. 假如说我们的合法代码集合是第一行所示。

比如说： 000 出错了，变成了 001，而 001 也在合法代码集合中，那么计算机是很难检测出这个代码出错了（或者根本检测不出来）

2. 改造一下，假如合法代码只包含 4 个，如第二行。编码的特点是：1 的个数是偶数个。

如果这个时候有 1 位错，

比如：000 存放在某个内存单元，但是读出的时候，我读到的是 100，那么，是可以检测到出错了；但是，能不能知道哪一位错误呢？不能

因为 000，101，110 的一位错，都可能造成 100

3. 如果采用【三倍冗余】的方式——即：用 000 表示 0，用 111 表示 1。

来看看能否检测出 1 位错，能否纠正 1 位错

比如：100，不在代码集合中。在出错的过程中，会有多种类型的故障，可能是 1 位错、2 位错、 3 位错，而 1 位错的概率最大，甚至超过 90%。所以，如果收到的出错的代码是 100 的话，那么，原始保存的代码应该是 000，于是，便判断出了是第一位错，并且可以纠错。

能不能判断两位错呢？比如：110，看上去好像是 000 发生两位错，实际上 111 也可能是发生 1 位错造成 110。所以【检 1 位错，纠 1 位错】

4. 合法代码集合：【四倍冗余】

这种情况下，检测出 1 位错，纠正 1 位错是没有问题的；我们来看一下能否检测出两位错

比如：1100 到底是哪两位出错，无法判断。

但是可以纠正 1 位错误，比如 1000，可以纠正 1→0

5.【5 倍冗余】

11000，便可以检测到两位错，能纠正这两位

如果是 11100，会纠正成为 11111，而检测不出来三位错

通过这里的分析，我们不禁回到之前提出的问题：编码的检测能力和纠错能力与什么有关呢？

通过分析：1 中，从一个合法代码到另外一个合法代码，至少要改变 1 位

2 中，从一个合法代码到另外一个合法代码，至少要改变 2 位

3 中，从一个合法代码到另外一个合法代码，至少要改变 3 位

所以：【任意两组合法代码之间二进制位的最少差异数】，差异越大，检错和纠错的能力就越强。我们可以得出结论

合法代码集合中的一个合法代码，把它变成这个集合中另外一个合法代码，需要改变的最少的二进制数的位数——就是【编码的最小距离】。

编码的纠错、检错能力与编码的这个最小距离直接相关。最小距离越大，检错和纠错能力就越强。我们可以用一个公式来描述检错能力、纠错能力与编码的最小距离 之间的关系，即：d-1 = e + t ( e ≥ t ) 这是一个经验公式。

如果 d=3，则 d-1=2，通过上面的分析我们可以看到，要使得编码具有一位的纠错能力，那么，它至少需要 1 位的检错能力。

同学们还可以思考一下，d 的最小值是多少？

由这个公式，我们可以看到，要提高校验码的检错和纠错能力，就必须增大码距，而增大码距又必须增加更多的校验位，这会带来时间和成本上的开销。

因此，需要综合考虑，选择性价比高的校验码。所以，我们主要讨论【奇偶校验】【海明码】【循环冗余校验】

SEC：Single-bit Error Correction （单位错误纠正），海明码便是这样的例子。

ECC：Error Correction Code 纠错码

而海明码是具有一位纠错能力的编码，除此之外，海明码还采用了奇偶校验的方式，而且是一种分组（非划分型分组）的奇偶校验。因此，我们首先学习奇偶校验。

奇校验——一个校验位+原来的数据位，使得代码中 1 的个数为奇数个。

偶校验——一个校验位+原来的数据位，使得代码中 1 的个数为偶数个。

二、奇偶校验和海明纠错码

我们来看看改进的奇偶校验（多重奇偶校验）：

原始数据：根据偶校验，分别在行和列进行【配偶】（配置到偶数个 1）。

在收到数据后，每行会产生一个偶校验位，每列也会产生一个偶校验位。

图 1：假设是 1 位错，则可以通过行、列定位出错位，并且可纠正这 1 位错。

但是对于图 3：第 3 行有偶数位错，那么这一行的【检错码】不会发生变化，因此，检测不到这样的错误。

大家可以验证：交叉校验编码可以检测出所有奇数位错、所有双位错、所有 3 位错，大多数 4 位错（4 个出错位正好位于矩形 4 个定点除外）；

可以纠正一位错、部分多位错误。

它大大降低了误码率，适用于中、低速度传输系统和反馈重传系统，被广泛应用于通信和某些计算机外部设备中。

海明纠错码

简单的奇偶校验把整个被校验的信息分成一组，且只设置一位校验位，因此检错能力弱，无纠错能力。1950，理查德海明提出海明校验，本质上是一种多重奇偶校验，既能检错、也能纠错。

理论依据：

海明码的编码最小距离 d=3，也就是非法的码字与合法的码字对应二进制位不同的个数最小为 3。根据：d-1=e(检错）+t（纠错），且 e≥t

得到：e+t=2

于是可以检测出 1 位错，并且纠正 1 位错，为了表达对海明的敬意，这种编码方法称为：Hamming ECC（Hamming Error Correction Code）

【例如】现在要传输的信息是一个 8 位的信息

先来看看奇偶校验，加上校验位后使得 1 的个数为偶数个（偶校验），如果我们读出来的信息发现 1 的个数是奇数个，我们便可以得知这 9 位代码中，有 1 位代码发生的翻转，使得 1 的个数由偶数个变成了奇数个，但是不知道是哪一个错。

于是，我们提出一种分组方法，来确定到底是哪一位错误。比如，我们采用两位奇偶校验，前面 4 位一组，后面 4 位一组（动画所示），如果是前面的 5 位中 1 的个数变成了奇数个，那么就可以肯定前面 5 位中有 1 位错误；如果是后 5 位信息发现 1 的个数是奇数个，就说明后 5 位中有 1 位错误。这样的话，编码出错的范围就被缩小了。这是一种【划分式】的分组方式。

而海明码的分组是一种【非划分】方式: 组和组是有交叉的。而刚才的分组中，组合组之间没有重叠，组和组合在一起，就是要传输的数据，而海明码之间的组和组是有交叉的。比如：1~7，7 位数据，分成 3 组，每组有 1 位校验位，所以，7 位中有 3 位校验位，4 位数据位。如何分组呢？（动画）每个圆圈表示一组，1，2，4 被分入 3 组；1+2=3 放重合位，1+4=5 放重合位， 2+4=6 放重合位，最后 7 放中间

分成了三组，每组都是偶校验的方式。

这三组中，每一组都有 4 位数据，有 1 位是校验位。

下面，我们要对每一组分别进行校验，三个组便生成 3 个校验结果：P3，P2，P1，如果没有任何差错，这三组的校验都为：0，即：000 （因为偶校验采用的异或来来实现，1 的个数是偶数个，所以校验的结果是 000），如果是 001，说明第一组出错，也就是【1】这个位置错了，（动画红色），也就是说，001 这个编码的值反映出了出差错的位置；如果校验结果是 101，说明第 1 组和第 3 组错了，即第 1 组和第 3 组公共的位置发生了错误，这个位置就是 5，正好也等于编码实际的值：101=5；后面的类似，大家可以类似分析。

所以结论是：用校验结果排列的二进制，便给出了错误的位置。

下面一个问题：校验位应该放在哪些位置呢？

因为校验位只会对这一组数据进行校验，所以，它绝不会和其他组共用位置，所以校验位，都放在【2 i】这个位置。

下面一个问题：

如何分组的呢？

        第一组：二进制代码，【从最右侧开始】都是 1，比如：1，3，5，7 的二进制是 001，011，101， 111,他们的最低位都是 1

        第二组：2，3，6，7 ： 010，011，110，111

        第三组：4，5，6，7 ： 100，101，110，111

如果这样分组，二进制编码的位置从右侧开始数，第一个值和第二个值都是 1，，比如 011，就说明，011 是第一组和第二组共有的，其他的类似，大家可以验证。

所以，1，2，4，8,….这样的位置，便是每一组独有的位置，用作校验位。

所以：如果我们采用偶校验，对海明码的每一组编码进行校验，得出的测试位 P3P2P1 进行有序的排列，得到的值便指出了出错代码的位置（或者，没有代码出错）。

海明码的组成

海明校验码一共 n 位：Hn…H2H1 ：n = k + r

k——信息位的数量

r——校验位的数量，也就是分成了 k 组

海明码公式的由来

我们的校验结果要指出这 k+r 位是哪一位错了，于是一共有 k+r 种情况（假设只能判断 1 位错），还有一种情况是没有错，所以，总共的状态数量是 k+r+1，而校验位是 r 位，因此可以列出这个方程。根据采用的是奇校验还是偶校验，来决定检测位的取值。现在默认采用“偶校验”，即：每一组编码中，1 的个数为偶数个。