一篇彻底学懂补码

最新推荐文章于 2024-06-29 16:47:43 发布

mkr67n

最新推荐文章于 2024-06-29 16:47:43 发布

阅读量1.7w

点赞数 99

分类专栏：算法文章标签：补码

本文链接：https://blog.csdn.net/mkr67n/article/details/114701908

版权

算法专栏收录该内容

6 篇文章 3 订阅

订阅专栏

简述

补码是计算机运算中的一种数据表示方式，它的存在意义是简化减法的运算。

许多人接触补码，仅是被告知是“正数不变，负数取反加一”，而对于为什么需要这么做，以及补码本身的存在意义并不清楚。
而网上关于补码的解释比较散，某些网站甚至充斥着太多乱而杂的说法，对初学者（我）而言痛苦不堪，故在此写一篇文章记录，希望其他人少走弯路

这篇文章的目的，则是从补码被发明的缘由说起，从根源上：

彻底梳理补码形成的过程，说明补码需要解决的问题
归纳补码的实质
解释补码用于数学运算的正确性
解释求补码（负数除符号位以外，按位取反加一）这一操作的可靠性
推导补码加减法的运算公式

摈弃错误观念

如果你对补码有以下误解，请从现在起忘记这些错误观点的存在：

补码是让正数变负数，负数变正数
补码是原码数与模互补的数

除了上面的错误观点以外，下面还有几点需要提醒，以免先入为主：

不要把补码与“对模求补”的操作直接关联，只需要把补码看成一种全新构造的二进制编码，不需要过度关注补字
补码的最高位是符号位，但它不是无依据地定义的，后面会解释补码最高位可以代表正负的原因

补码的形成

契机

在计算机的硬件结构中，实现加法器比实现减法器简单的多。人们希望的是构造出一套 “用加法代替减法” 的运算逻辑，构造的结果也就是现在我们所使用的“补码”。

最初的探索

缘起于日常生活的现象，时钟的顺拨与倒拨均可以达到同一钟点
在这里插入图片描述

如上图，十二小时制中，分针由8点拨到6点，有两种方式：

:逆时针拨2小时：8-2=6时
顺时针拨10小时：8+10=6时

第二种方式本来应该为18时，但由于时钟是十二小时制计时，产生了溢出，显示的是18-12=6时
而第二种形式，则是用加法代替了第一种形式的减法

这正是我们想要的，于是对于“以加代减”的逻辑，有了最初的构造：

时钟超出显示上限，则只显示余下的钟点，这恰好是模数加法运算的体现：
说人话就是：在模12的情况下（或者说对12取余），以下式子是等价的：

$(8 - 2) m o d 12 = (8 + 10) m o d 12 = 6$

按照这个思路，我们在模范围内，也许可以将“X－Y”的减法变更为“X＋Y的补数”的加法。

注：所谓m的补数就是：(模-m)的值，如2的补数是12-2=10

模数加法的局限

模数加法代替减法是一个很好的思路，但它并不是完美的

上面提及到的情况，事实上只是 “大减小” 的情况，如果出现 “小减大” 情况就出现矛盾了：
举个例子，在模100的情况下，套用上面的模数加法公式企图代替减法：

$(10 - 30) m o d 100 = - 20$
$(10 + (100 - 30)) m o d 100 = 80$

这和说好的不一样啊，80显然不等于-20，而且也没有因为超越模数而引起取余运算。
然而先贤们并不打算前功尽弃……

负数的表示法

他们为了继续使用模数加法代替减法，他们做了一个大胆而又粗暴的定义：让80等于-20，即用80代表-20

根据这个规律，推广到一般的情况就是：
负数的表示方式就是它绝对值的补数——规则①

这样做有两个好处：

消除了“小减大”情况下的歧义，使得该情况也可用模数加法代替减法
此定义同样可以解释“大减小”的情况，因为它同样吻合 将“X－Y”的减法变更为“X＋Y的补数” 的说法（视 -Y 作负数，则它的表示为Y的补数）

这样做后，无论是“大减小”或是“小减大”，模数加法代替减法都已可适用，可以说已经形成了一套较为通用的以加代减体系。

该负数表示法的结果与缺点

但是注意到，像80这样的大数，失去了自己的意义，在模100的情况下，无法再表示80了。
更一般地，因为我们希望正负数尽量成对出现，而且打算用正数表示负数，这意味着在模100的非负数之间，需要划分一半正数用于表示负数
结合规则①的负数表示方式，最终满足这一系列条件的结果是：

在模100条件下：0 ~ 49表示正数本身； 50 ~ 99表示各自补数的负值（如98代表-2）

更一般地：模n情况下，0 ~ n/2 -1表示本身，n/2 ~ n-1表示各自补数的负值——规则②

补码的内涵

补码的实质

所谓补码，其实只是：非负数和规则①表示的负数，在二进制形式下的表示
所以虽然补码叫补码，但事实上它的本质和补字没有直接关联，它只是一种为了实现模数加法代替减法而构造出来的数字映射罢了。

补码并非在二进制中才有用，根据上面的定义，无论任何进制都不会改变补码体系的准确性。二进制与其它进制，影响只是求补码的简便方式（下面会提及）

补码最高位为符号位的解释

补码在二进制中的最高位为符号位，其实是因为规则②中，把半模以上的数用作表示负数，而恰好半模以上的数，在二进制表示中的最高位就是1，半模以下最高位是0。

因此，从数字映射来讲，半模以上的正数确实被规则①映射为了负数；但是单论二进制数字而言，最高位的1仅代表它是半模以上的数，脱离了规则①它与正负符号没有任何关系。

总之，尽管在补码中，最高位确实可以简单地看做正负标志，但是需要注意的是，这种做法事实上有迹可循，千万不要想当然地以为这只是一种毫无根据的硬性规定

证明补码在加减运算的正确性

说了那么多，一直在被定义概念牵着走，我相信不少人会有一个疑问：做这么多都只是人为规定罢了，有没有证明补码在加减运算中正确性的途径？

虽然补码的制定上很巧妙，并不是一般人就能制定出这一套近乎完美的以加代减规则的，但是要证明补码的正确性，则相对于制定简单得多。

不严谨证明如下：
目标：由补码的实质，显然我们没有对非负数做任何调整，我们只是针对负数做了一个映射。如果我们能说明这种映射是可靠的，那么补码就是正确的。

前面也说了，补码从定义上就决定了不会因为进制改变而丢失正确性，因此以下用十进制形式说明

假设一个补码正数x，它的补码负数是y（即在补码中表示x相反数的数），在模 $2^n$ 的情况下，我们只要能证明：对任意的正数x通过使用补码计算都有 $x + y)mod 2^n = 0$ ，那么我们就说明了这种负数映射是可靠的，进而说明补码运算的正确。

由规则①： $y = 2^n - x$
对任意x，有： $x + y)mod 2^n = (x + 2^n - x)mod 2^n =(2^n)mod 2^n = 0$
正数+它的相反数恒为0，这就说明了这种正数到负数的映射是正确的。

不过这个证明并不包括边缘值（最小负数），至于这个东西的补码，似乎就真的只是人为规定且恰好不违反规则①了（）

原码到负数补码的转换

按位取反加一

上面基本讲解了补码的意义与本质，现在剩下的问题就是在二进制中：原码负数如何求补码？
我们总不能按规则①，依靠十进制定义来求负数表示，再转换成二进制吧？
我们希望的是找到一种原码直接转换成补码的形式

也就是我们喜闻乐见的“除符号位以外，按位取反加一”

为什么？

其实仍然是从规则①入手得到的规律：
设一个十进制数x的原码为： $x]_原 = 1x_1x_2...x_n$ ， 0 ≥ x > -2 $^{n}$
则它的绝对值|x|的原码为： $x|]_原 = 0x_1x_2...x_n$ ， 0 ≤ x < -2 $^{n}$
则它的绝对值|x|的补码为： $x|]_补 = 0x_1x_2...x_n$ ， 0 ≤ x < -2 $^{n}$

根据规则①有： $x]_补 = (2^{n+1})_D - [|x|]_补$ （D表示十进制数）

统一为二进制，并转换为竖式计算：

$\begin{aligned} 1\;\, 0\;\, 0\;\, 0\;\, ...0\;\, \\ \underline{- 0\;x_{1}x_{2}...x_{n}}\\ \end{aligned}$

被减数拆为111…1 + 1得：

$\begin{aligned} \;\, 1\;\, 1\;\, 1\;\, ...1\;\, + \;\,1\\ \underline{- 0\;x_{1}x_{2}...x_{n}\quad\quad\,}\\ 1\;\overline{x}_1\overline{x}_2...\overline{x}_n + \;\,1\\ \end{aligned}$

因此得到
$[x]_补 = 1\;\overline{x}_1\overline{x}_2...\overline{x}_n + \,1$
对比原码：
$x]_原 = 1x_1x_2...x_n$
恰好就得到了“符号位不变，其余按位取反加一”的结论

补码的定点加减法运算

最后回顾到补码本身的作用，考察补码是如何只用加法器实现加减法的。而对于乘除法，补码并没有太大优势，都是“硬件迎合补码”，而非如同加减那样“补码迎合硬件”，故不在此赘述。

补码加法公式

设x,y为两个十进制数，则有：
$[x]_补+[y]_补=[x+y]_补\qquad(mod\ 2^{n+1})$

补码加法正确性

分四种情况讨论。

首先由于保证运算结果不溢出，即约定范围：
$x|<(2^n-1),|y|<(2^n-1),|x+y|<(2^n-1)$
（1） $x > 0, y > 0$ , 则 $x + y > 0$

相加两数都是正数，和也是正数。
由正数补码的定义，用十进制表示有：
$[x]_补=x,\quad[y]_补=y,\quad[x+y]_补=x+y$

故有：
$[x]_补+[y]_补=x+y=[x+y]_补\qquad(mod\ 2^{n+1})$
（2） $x > 0, y < 0$ , 则 $x + y > 0$ 或 $x + y < 0$

相加两数一正一负，和符号不确定。
由正、负数补码的定义，用十进制表示有：
$[x]_补=x,\quad[y]_补=2^{n+1}-|y| = 2^{n+1}+y$

$\quad$ （i） $x + y > 0$ ，则：

$x+y]_补=x+y$

$\quad$ 故有：

$[x]_补+[y]_补=x+2^{n+1}+y=x+y=[x+y]_补\qquad(mod\ 2^{n+1})$
$\quad$ （ii） $x + y < 0$ ，则：

$x+y]_补=2^{n+1}-|x+y|=2^{n+1}+(x+y)$

$\quad$ 故有：
$[x]_补+[y]_补=x+2^{n+1}+y=[x+y]_补\qquad(mod\ 2^{n+1})$
（3） $x < 0, y > 0$ , 则 $x + y > 0$ 或 $x + y < 0$

同（2）可证，令x,y对调即可

（4）（2） $x < 0, y < 0$ , 则 $x + y < 0$

相加两数都是负数，和也是负数。
由负数补码的定义，用十进制表示有：
$[x]_补=2^{n+1}+x,\quad[y]_补=2^{n+1}+y$

$x+y]_补=2^{n+1}-|x+y|=2^{n+1}+(x+y)$

故有：
$[x]_补+[y]_补=2^{n+1}+x+2^{n+1}+y=2^{n+1}+(x+y)=[x+y]_补\qquad(mod\ 2^{n+1})$

综上所述：
无论x,y正负性如何，都有：任意两数的补码之和等于两数之和的补码，故补码加法公式成立

补码减法公式

$[x]_补-[y]_补=[x]_补+[-y]_补=[x-y]_补\qquad(mod\ 2^{n+1})$

补码减法正确性

先证明： $y]_补=-[y]_补$

由： $[x]_补+[y]_补=[x+y]_补\qquad(mod\ 2^{n+1})$

得： $[y]_补=[x+y]_补-[x]_补\qquad(mod\ 2^{n+1})\qquad①$

又由： $[x-y]_补=[x+(-y)]_补=[x]_补+[-y]_补\qquad(mod\ 2^{n+1})$

得： $[-y]_补=[x-y]_补-[x]_补\qquad(mod\ 2^{n+1})\qquad②$

①+②得： $\begin{aligned} [y]_补+[-y]_补&=[x+y]_补-[x]_补+[x-y]_补-[x]_补\\ &=[x+y+x-y]_补-[x]_补-[x]_补\\ &=[x+x]_补-[x]_补-[x]_补\\ &=[x]_补+[x]_补-[x]_补-[x]_补\\ &=0 (由于[x]_补=[x]_补可得[x]_补-[x]_补=0)\qquad(mod\ 2^{n+1})\\ \end{aligned}$

即： $y]_补=-[y]_补$

上式代入加法公式： $[x]_补+[-y]_补=[x-y]_补\qquad(mod\ 2^{n+1})$

得： $[x]_补+[-y]_补=[x]_补-[y]_补=[x-y]_补\qquad(mod\ 2^{n+1})$

上式证明了补码减法公式的正确性，以及提供了以加代减的具体操作方式

[y]补求 [-y]补的法则

减法中需要以 $y]_补$ 求 $y]_补$ 实现以加代减，那么是不是有简便的转换法则呢？确实有的

法则：

包括符号位“按位取反再加一”

为什么?

设一个十进制数y的补码为： $y]_补 = ay_1y_2...y_n$ ，其中a为符号位
（1）若y>0，则a=0
y的原码为： $y]_原 = 0y_1y_2...y_n$
-y的原码为： $y]_原 = 1y_1y_2...y_n$

则：
-y的补码为： $[-y]_补 = 1\overline{y}_1\overline{y}_2...\overline{y}_n+1$
对比y补码： $y]_补 = 0y_1y_2...y_n$

符合上述法则

（2）若y<0，则a=1
y的原码为： $[y]_原 = 1\overline{y}_1\overline{y}_2...\overline{y}_n+1$
（补码求原码也可以是符号位不变，其余按位取反加一，“取反加一与减一取反”在二进制中是等价的，有兴趣的可以百度）
-y的原码为： $[-y]_原 = 0\overline{y}_1\overline{y}_2...\overline{y}_n+1$