目录
1.整数在内存中的存储
- 整数的二进制表示方法有三种,分别是原码、反码和补码。
- 三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”,而数值位最高位的一位被当做符号位,剩下的都是数值位。
那么接下来我们先了解一下原、反、补码是什么
- 原码:直接将数值按照正负数的形式翻译成二进制得到的就是原码。
- 反码:将原码的符号位不变,其他位依次按位取反可以得到反码。
- 补码:反码+1就得到补码。
注意:
- 正整数的原码、反码、补码都相同。
- 负整数的三种表示方法各不相同。
对于整型来说:数据存放在内存中其实存放的是补码。
为什么呢?
在计算机系统中,数值一律用补码来表示和存储。
原因在于:使用补码,可以将符号位和数值域统一处理;
同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。
2.浮点数在内存中的存储
- 浮点数常见的类型有:float, double, long double。
- 浮点数表示的范围:在float.h中定义(整数范围在limits.h中定义)。
例如float的最大值和最小值(可在everything上查看)。
2.1练习(引入)
#include<stdio.h>
int main()
{
int n = 9;
float* pFloat = (float*)&n;
printf("n的值为:%d\n", n);
printf("*pFloat的值为:%f\n", *pFloat);
*pFloat = 9.0;
printf("n的值为:%d\n", n);
printf("*pFloat的值为:%f\n", *pFloat);
return 0;
}
该段代码的结果为:
可以得出一个简单的结论:整数和浮点数在内存中的存储方式是不一样的。
至于浮点数是怎么存储,这个题的结果又该如何解释呢?我们先往下走。
2.2浮点数的存储
上面的代码中,n和*pFloat在内存中明明是同一个数,为什么浮点数和整数的解读结果会差别这么大?
要理解这个结果,一定要搞懂浮点数在计算机内部的表示方法。
根据国际标准IEEE(电气和电子工程协会)754,任意一个二进制浮点数V可以表示成下面的形式:
举个例子:
- 5.5是十进制浮点数的表示形式,那我们把它写成二进制就是101.1。
- 用科学计数法的表现形式可以把它写成1.011*2^2(因为是二进制所以底数是2)
- 那么,按照上面V的格式,可以得出S = 0, M = 1.011, E = 2
所以浮点数的存储,其实存储的就是S, M, E相关的值。
IEEE754规定:
- 对于32位的浮点数(float),最高的1位存储符号位S,接着的8位存储指数E,剩下的23位存储有效数字M(画的不太好差不多就是这个意思)
(图中最后一个M应是23bit,打错啦!!)
- 对于64位的浮点数(double),最高的1位存储符号位S,接着的11位存储指数E,剩下的52位存储有效数字M
- double类型能存储52位的有效数字,精度高于float类型,这也可以作为double被称作双精度浮点数,而float被称作单精度浮点数的一个依据。
2.2.1浮点数存的过程
IEEE754对有效数字M和指数E,还有一些特别的规定。
- M的大小范围是1 <= M < 2,也就是说,M可以写成1.xxxxxx的形式,其中xxxxxx表示小数部分。
- IEEE754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.011时,只保存011,等到读取的时候,再把第一位的1加上去。这样做的目的是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字。
至于指数E,情况就比较复杂。
- 首先,E为一个无符号整数(unsigned int)。
- 这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127;对于11位的E这个中间数是1023。比如2^10的E是10,所以保存成32位浮点数时,必须保存成10 + 127 = 137,即10001001。
那么会不会存在即使我们加上了这个中间值,还是负数的情况呢?
显然是不会的。
因为即使是浮点数也是有最大值和最小值的。E也是有最大值和最小值的。
有些情况下,浮点数在内存中是无法精确保存的。
例如:
#include<stdio.h>
int main()
{
float f = 0.4554f;
printf("%.10f\n", f);
return 0;
}
结果为:
无限接近于0.4554,但却不能精确存储0.4554。
2.2.2浮点数取的过程
指数E从内存中取出可以分为三种情况:
E不全为0或不全为1
- 这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。
- 比如:0.5的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为1,0 * 2 ^ (-1),127(中间值) + (-1) = 126,表示为01111110,而尾数去掉整数部分1,小数部分为0,只要在后面补0到32位即可。其二进制形式表示为:
0 01111110 00000000000000000000000
E为全0
- 在我们加上中间值127时E竟然为全0,那么我们原本的E是-127,在二进制中表示为一个1.xxxxxx的数乘上2 ^ (-127)
- 这是一个非常非常小的数!
- 这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于0的很小的数字。
E为全1
- 这时,如果有效数字M全为1,表示±无穷大(正负取决于符号位S)
浮点数的表示规则我们就说到这里。
2.3题目解析
下面让我们回到一开始的练习题。
- 9先以整数的形式存储在内存中,二进制表示为:
0000 0000 0000 0000 0000 0000 0000 1001
首先,将9的二进制序列按照浮点数的形式拆分:
0 00000000 00000000000000000001001
得到第一位符号位S = 0,后面8位的指数E = 00000000,最后23位有效数字M = 000 0000 0000 0000 0000 1001
由于指数E全为0,所以符合E为全0的情况。因此浮点数V就写成:
V = (-1) ^ 0 * 0.00000000000000000001001 * 2 ^ (-126) = 1.001 * 2 ^ (-146)
显然,V是一个很接近于0的正数,所以用十进制小数表示就是0.000000。
- 再看浮点数9.0,为什么整数打印的是1091567616
首先浮点数9.0等于二进制的1001.0,换算为科学计数法是:1.001 * 2 ^ 3
所以9.0 = (-1) ^ 0 * (1.001) * 2 ^ 3,
那么,第一位符号位S = 0,有效数字M = 001 0000 0000 0000 0000 0000,指数E = 3 + 127 = 130,即10000010
所以写成二进制形式:
0 10000010 00100000000000000000000
这个32位的二进制数,被当做整数来解析的时候,就是整数在内存中的补码, 而正整数在内存中补码和原码相同,换算成十进制就是最后的结果,1091567616。