前言
以32位系统为例。
C语言规定,二进制的最高位为符号位,0-正数,1-负数。
因此 6
和 -6
可以初步表示为 00000000 00000000 00000000 00000110
和10000000 00000000 00000000 00000110
,称为原码。
我们知道在计算机中,加法器
实现最简单,所以很多运算最终都要转为加法运算
,因此
6 - 6 = 6 + (-6)
00000000 00000000 00000000 00000110
10000000 00000000 00000000 00000110
-----------------------------------
10000000 00000000 00000000 00001100 = -12
显然是不对的,所以如此来看,减法运算是有问题的。
于是科学家们开始继续想办法。
模(Modulo)
什么是模数
In mathematics, modular arithmetic is a system of arithmetic for integers, where numbers “wrap around” upon reaching a certain value—the modulus (plural moduli).
理解
模
是指一个计量系统的计数范围。如时钟等。计算机也是一个计算器,它也是有一个计量范围,即都存在一个模。
如时钟的计量范围是0~11
,模为12
。
32位计算机的计量范围是2^32
,模为2^32
。
模是计量器产生“溢出”的量,它的值在计量器上表示不出来,计量器上只能表示出模的余数,如12的余数有0,1,2,3,4,5,6,7,8,9,10,11
。
补数
假设当前时针指向11点,如果将其拨到8点,调整的方式有两种:
-
一种是倒拨3小时,即:
11-3=8
-
另一种是顺拨9小时:
11+9=12+8=8
在以模为12的系统中,加9 和 减3效果是一样的,因此凡是减3运算,都可以用加9来代替。对模12而言,9和3互为补数
(二者相加等于模)。所以我们可以得出一个结论,即在有模的计量系统中,减一个数等于加上它的补数,从而实现将减法运算转化为加法运算的目的。
从上面的化减法为加法,以及所谓的溢出等等可以看到,模可以说就是一个太极,阴阳转化,周而复始,无始无终,循环往复。
补码原理
有了上面的结论,可以尝试将补数的方式引入到减法运算中,计算机上的补码对应算术里的补数。
假设我们有一个 4 位的计算机,则其计量范围即模是2^4 = 16
,所以其能够表示的范围是0~15
,现在以计算 5 - 3
为例,转化为加法的过程如下:
# 按以上理论,减一个数等于加上它的补数,所以
5 - 3
# 等价于
5 + (16 - 3) // 算术运算单元将减法转化为加法
# 用二进制表示则为:
0101 + (10000 - 0011)
# 等价于
0101 + ((1 + 1111) - 0011)
# 等价于
0101 + (1 + (1111 - 0011))
# 等价于
0101 + (1 + 1100) // 括号内是3(0011)的反码+1,正是补码的定义
# 等价于
0101 + 1101
# 所以从这里可以得到
-3 = 1101
# 即 -3 在计算机中的二进制表示为 1101,正是 -3 的正值 3(0011)的补码(1101)。
# 最后一步 0101 + 1101 等于
10010
因为我们的计算机是 4
位的,第一位溢出
了,所以我们只保存了 4
位,即 0010
,而当计算机去读取时这正是我们所期望的 2
。叹为观止吧,天才般的设计!感恩伏羲、莱布尼兹和冯诺依曼!
所以,概括一下负数的补码计算方式
- 将负数取绝对值,然后转换成二进制。
- 对转化的二进制数逐位取反。
- 对取反后的二进制数加1。
当然,还有人说可以这么算
- 将负数转换成二进制。
- 保留最高位1不动,并逐位取反。
- 对取反后的二进制数加1。
其实效果是一样的,因为负数的最高位总是1,但是从推导过程来看,显然取绝对值的版本比较贴切。
至此,负数的二进制有了更好的表示方式,那就是补码,这也是现在计算机中对于负数的实际表示,最开始的原码就没用了;当然,正数还是原封不动。
之所以负数要使用补码来存储,本质上是为了更方便加法运算。
那么,问题来了。
我从内存读取了 10000000 00000000 00000000 11111011
,我怎么知道它是正数还是负数呢?
答案是,只从这些是无法辨别一个二进制是正是负的。
实际上,这些是由编程语言实现,在C语言中,在定义一个整型的时候,是可以指定是否区分正负,如果是 unsigned int ,那就是正数看待,否则就区分正负。