1. 浮点型数据在内存中的存储
常见的浮点数:
3.1415926
1E10 //1.0*10的10次方
浮点数家族包括:
float
double
long double
浮点数表示的范围:float.h中定义
2. 浮点数存储规则
要理解这个结果,一定要搞懂浮点数在计算机内部的表示方法。
详细解读:
根据国际标准IEEE(电气和电子工程协会)754,任意一个二进制浮点数V可以表示成下面的形式:
(-1)^S * M * 2^E
(-1)^S表示符号位,当S=0,V为正数;当S=1,V为负数
M表示有效数字,取值范围大于等于1,小于2
2^E表示指数位
举例来说:
十进制的5.0,写成二进制是101.0,相当于1.01*2^2
那么,按照上面V的格式,可以得出S=0,M=1.01,E=2。
十进制的-5.0,写成二进制是-101.0,相当于-1.01*2^2
那么,按照上面V的格式,可以得出S=1,M=1.01,E=2。
IEEE 754规定:
对于32位的浮点数(float),最高的1位是符号位S,接着的8位是指数E,剩下的23位为有效数字位。
对于64位的浮点数(double),最高位的1位是符号位S,接着的个位是指数E,剩下的52位为有效数字位M。
IEEE754对有效数字M和指数E,还有一些特别规定。
前面说过,1<=M<2,也就是说,M可以写成1.xxxxxx的形式,其中xxxxxx表示小数部分。
IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.01101的时候,只保存01101,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位浮点数为例,留给M只有23位。
将第一位的1舍去以后,等于可以保存24位有效数字。
至于指数E,情况就比较复杂。
首先,E为一个无符号整数(unsigned int)
这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047;
但是,我们知道,科学技术法中的E是可以出现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127,对于11位的E,这个中间数是1023。
比如,2^10的E是10,所以保存成32位浮点数的时候,必须保存成10+127=137,即10001001。
V =0.5f
=0.1
=1.0 * 2 ^ -1
=(-1)^0 * 1.0 * 2 ^ (-1)
S=0 M=1.0 E=-1
float -> E(真实值)+127(中间值)-> 126 - 存储
double -> E(真实值)+1023(中间值) -> 1022 - 存储
int main()
{
float f = 5.5;
//bit:101.1
//1.011*2^2
//s=0,m=1.011,e=2
//e=2+127=129
// 0 10000001 01100000000000000000000
//bit:0100 0000 1011 0000 0000 0000 0000 0000
//hex:0x40 B0 00 00
return 0;
}
内存:小端存储。
然后,指数E从内存中取出还可以在分成三种情况:
E不全为0或者E不全为1
这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。
比如:
0.5*(1/2)的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为1.0*2^(-1),其E等于-1+127=126,表示为01111110,而尾数1.0去掉整数部分为0,补齐0到23位的数00000000000000000000000,则其二进制表示形式为:0 01111110 00000000000000000000000
E全为0
这时,浮点数的指数E等于1-127(或者1-1023)即为真实值。
有效数字M不再加上第一位的1,而是还原为0.xxxxxxx的小数,这样做是为了表示+-0,以及接近于0的很小的数字。
E全为1
这时,如果有效数字M全为0,表示+-无穷大(正负取决于符号位S)
解读浮点数存储的例子:
int main()
{
int n=9; //n的数值为整数
//n为正数原反补码相同:00000000000000000000000000001001
float *pFloat = (float *)&n;
printf("n的值为:%d\n",n);// 9
//%f,打印6位小数点的浮点数数据,但是*pFloat指向的数据是n,对pFloat指针解引用,得到n的值。
//【0 00000000 0000000000000000000000001001】
//按照E全为0的时候的规则,计算E的真实值=-126
//M=0.0000000000000000000000001001
//s=0 为正数
//V=+0.0000000000000000000000001001 * 2^-126
printf("*pFloat的值为:%f\n",*pFloat);// 0.000000
*pFloat=9.0; //改变n的值为一个浮点数9.0
//n是以浮点数的存储形式存储的
//1001.0
//(-1)^0 * 1.001 * 2^3
//S=0 E=3+127 M=00100000000000000000000
//0 10000010 00100000000000000000000
//bit:01000001000100000000000000000000
printf("n的值为:%d\n",n); //打印一个非常大的正数
//但是这里是用%d的形式打印的,根据最高位是否为0/1,判断正负数
//01000001000100000000000000000000
printf("*pFloat的值为:%f\n",*pFloat); //解引用n的值为9.000000
return 0;
}
结果:
思考:num和*pFloat在内存中明明是同一个数,为什么浮点数和整数的解读结果会差别这么大?