今天来聊聊整数浮点数在计算机中的存储。
一、原码,补码,反码
计算机为了表示负数,会将最高位设置为符号位。比如一个char类型的数据用8位存储,那么最高位为0,说明是正数,最高位为1说明是负数。
比如10可以表示为00001010,-10表示为10001010。
计算机中只有加法器,为了进行减法运算,我们引入反码和补码的概念。正数的原码、反码、补码都为它本身。负数的反码是所有位数除符号位都取反。补码则是在反码的基础上再加一。
这样计算机就可以使用加法器进行减法运算。
二、大小端字节序
数据在计算机中是以二进制存储的。以一个字节作为内存单元。如果你要在计算机中存储一个int整型变量,需要用到四个字节。比如储存16,那么在内存中是这样显示的00 00 00 10。不同的计算机把10这个字节储存的相对位置不同。小端字节序,指的是低位字节储存在低地址,高位字节储存在高地址。大端字节序正好相反。
三、signed和unsigned的区别
这两个关键字用于修饰变量类型。在int前面加上unsigned,指的是数据大于等于零,同样,char long等类型也可以加上unsigned修饰。变量类型默认是signed的,即数据也可以小于零。
对于signed数据来说,以char为例。当数据从1开始不断增大时,增大到127,下一个数字就是128。这是由计算机存储方式决定的。因为127的补码是0111 1111,加一之后变成了1000 0000,就被计算机解析为负数。如果继续增加数据,char会被解析为绝对值不断减小的负数,直到为0。完成一个循环。
对于unsigned数据来说,同样以char为例。当数据从1开始不断增大时,会达到最大值255。之后数据再增加,就变为0,完成一次循环。
四、浮点数的存储
按照IEEE754的标准,浮点数的存储包含三个部分。符号位S,有效数字M,指数E。跟之前的一样,符号位代表正负。有效数字M的取值范围是1<=M<2,E的值代表了2的指数。计算公式为
(-1)^S*M*2^E.
其中M的存储比较特别,省略了开头的1,只保留小数点后的部分,如1.01(代表1+1/4)储存在单精度浮点数据中的部分为0100 0000 0000 0000 0000 000(总共23bit)。指数E以二进制的方式存储,并且为了让E能够表示负数,设定了一个中间值。当E的存储值等于中间值的时候,我们认为E为零。每次调用E都先用E减去这个中间值。在单精度浮点数里,E储存8位。双精度储存11位。
本质上是二进制下的科学计数法。