汉明码的构造原理
“汉明码”,英文名为 “hanming code”,是一种“错误纠正码”,由 理查德·卫斯里·汉明于1950年发明,它可以用来检测并且纠正数据从发送端发往接收端中发生的错误。时至今日仍在ECC memory 上显示其应用价值。
汉明码实质是一种多重奇偶校验,它在有效信息位中加入几个校验位形成汉明码,使码距比较均匀的拉大,具有检验并纠正一位错误的能力。“校验位”是一种二进制位,它被用来添加到需要传输的数据信息中,以确保信息在传输过程中不会发生丢失或者改变。
“校验位”究竟有多少位,我们使用以下公式来计算:
2k >= N+K+1
其中,K代表校验位的位数,N代表信息位的位数。信息位N值与校验位K值的对应关系表如下:
在通过公式确定了校验码的位数后,接下来给大家介绍如何确定校验码的位置。校验码Ci必须是在2的i-1次方位置,只能放在例如1,2,4,8,16...的位置(位置从右向左排序)。
假如目前有一个三位信息码(D1,D2,D3),那么校验位与信息位排列的位置是这样的:
C1,C2,C3 为奇偶校验位,其余三位D1,D2,D3 为信息位。
那么,哪个校验位管哪组数据呢?接下来要介绍汉明码的核心编码方法,将索引的二进制形式表示出来:
6 | 110 |
5 | 101 |
4 | 100 |
3 | 011 |
2 | 010 |
1 | 001 |
从右往左(低位往高位)数,第一位是“1”的索引有001,011,101,分别对应的十进制索引为1,3,5,那么这几个十进制对应的数据位和“奇偶校验位”C1构成了一组。
同理,可确定第二位是“1”的索引有010,011,110,分别对应的十进制索引为2,3,6,那么这几个十进制对应的数据位和“奇偶校验位”C2构成了一组。
第三位是“1”的索引有100,101,110,分别对应的十进制索引为4,5,6,那么这几个十进制对应的数据位和“奇偶校验位”C3构成了一组。
确立好分组之后,接下来需要填充数据位,假设传输3位数据位:101
1 | 0 | C3 | 1 | C2 | C1 |
然后,我们就需要填充每一组的“奇偶校验位”。(采用偶校验)
对于第一组来说(1,3,5位为一组):1的个数为1个,奇数个,因此C1应该为1,这样1的个数最后才能保证为偶数。
同理,对于第二组来说(2,3,6位为一组):1的个数位2个,偶数个,因此C2应该为0,这样1的个数最后才能确保为偶数。
对于第三组来说(4,5,6位为一组),1的个数为1个,奇数个,因此C3应该为1,这样1的个数最后才能确保为偶数。
最后,总的汉明码构造完毕,如下所示:
1 | 0 | 1 | 1 | 0 | 1 |
小贴士:给大家介绍一下“奇偶校验位”。一个奇偶校验位是用来添加至二进制数据中的比特位,它通过确保整个二进制数据信息中“1”的个数是奇数还是偶数,来判断数据是否在传输过程中发生改变。奇校验会检查数据中“1”的个数是否为奇数,如果不是,则会在校验位中添加一个“1”,反之,会在校验位中添加一个“0”。同学们可以据此推出偶校验的方法。
作者:速易芯刘彦