浮点数在内存中的储存会根据国际标准IEEE(电气和电子工程协会)754,任意一个二进制浮点数V可以表示成以下的形式
V = (-1)^S * M * 2^E
(-1)^S:表示符号位,当S=0;V位正数;当S=1,V为负数
M:表示有效数字,M时大于等于一,小于二的
2^E:表示指数位
例子1:十进制的3.0,写成二进制是011.0,相当于1.1*2^1。
可以通过上面的公式得出S=0,M=1.1,E=1。
例子2:十进制的-5.0,写成二进制是-101.0,相当于-1.01*2^2。那么S=1,M=1.01,E=2。
在IEEE 754中规定:
32位的浮点数(float),最高的1位存储符号位S,接着的8位储存指数E,剩下的23位存储有效数组M
64位的浮点数(double),最高的1位存储符号位S,接着的11位储存指数E,剩下的52位存储有效数组M
浮点数储存的大小分配
32位:
64位:
浮点数储存的过程
有效数字M:
IEEE 754对有效数字M和指数E还有些特殊规定,1<=M<2,也就是说可以写成1.xxxxxxxx的形式,IEEE 754规定,计算机内保存M时默认第一位是1,因此舍去1,保存后面的小数,需要读取时再吧第一位的1加回去。这样可以腾出一个有效数字,如32位浮点数原本有23位有效数字,将第一位舍去后就变成了24位有效数字了。
指数E:
E是一个无符号整数(unsigned int),但是在科学计数法中的E是允许出现负数的,所以IEEE 754中规定,在讲E存入内存的真实值必须加上一个中间数,如8位的E,它的取值范围是0~255,就需要加上127。比如2^10的E是10,在存成32位浮点数时就需要存成10+127=137,转换后为10001001。