浮点数
常见的浮点数:3.14159、1E10(表示1*10^10)等
浮点数家族包括: float、double、long double 类型。
浮点数表示的范围在float.h 中有定义
浮点数的存储
浮点数在计算机内部是怎么表示的呢?
根据规定,任意一个二进制浮点数V可以表示成下面的形式:
举例来说:
十进制的5.0,写成⼆进制形式是 101.0
,科学计数法就相当于 1.01×2^2
。
那么,按照上⾯V的格式,5.0为正数,可以得出S=0,M=1.01,E=2。
如果是十进制的 -5.0,写成⼆进制是 -101.0
,相当于 -1.01×2^2
。
那么,S=1,M=1.01,E=2。
根据规定:
对于32位的浮点数,最高的1位存储符号位S,接着的8位存储指数E,剩下的23位存储有效数字M
类似的
对于64位的浮点数,最高的1位存储符号位S,接着的11位存储指数E,剩下的52位存储有效数字M
浮点数的存储
这里要注意的是,首先我们前面说过, 1≤M<2
,那么M可以写成 1.xxxxxx 的形式,其中 xxxxxx 表示小数部分。
所以根据规定,在计算机内部保存M时,默认这个数的第一位是1,因此可以被舍去,只保存后⾯的xxxxxx部分。
比如要保存1.01的时候,只保存01,等到我们需要读取的时候,再把第⼀位的1加上去。这样做的⽬目的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第⼀位的1舍去以后,等于可以保存24位有效数字。
而对于E也有一些规定
首先我们要知道的是E是一个无符号整数,如果E为8位,它的取值范围为 0 ~ 255, 如果E为11位,它的取值范围为0 ~ 2047。但是当我们使用科学计数法的时候,E是有可能为负数的,所以根据规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。
所以,当我们的E是-10的时候,存储的时候就是-10 + 127 = 117,就可以正常的使用E存储一负数了。又例如2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001,当读取的时候就将所读取的数 - 127,只是存储的时候要 +127
浮点数的读取
指数E从内存中读取时可以分成三种情况:
1.E不全为0或不全为1
这时,浮点数就采⽤下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第⼀位的1。
比如:0.5 的⼆进制形式为0.1,(小数点后面一位,权重位2^(-1),以此类推,所以这里是1 * 2^(-1) = 0.5)由于规定正数部分必须为1,即将小数点右移1位,则为1.0*2^(-1),其阶码为-1+127(中间值)=126,表示为01111110,而尾数1.0去掉整数部分为0,补齐0到23位,00000000000000000000000,则其⼆进制表示形式为:
0 01111110 00000000000000000000000
2.E全为0
有效数字M不再加上第⼀位的1,⽽是还原为0.xxxxxx的小数,这表示一个接近于0的浮点数,正负看符号位
0 00000000 00100000000000000000000
3.E全为1
这时,如果有效数字M全为0,表⽰±⽆穷⼤(正负取决于符号位s)
0 11111111 00010000000000000000000
例题
#include <stdio.h>
int main()
{
int n = 9;
float *pFloat = (float *)&n;
printf("n的值为:%d\n",n);
printf("*pFloat的值为:%f\n",*pFloat);
*pFloat = 9.0;
printf("num的值为:%d\n",n);
printf("*pFloat的值为:%f\n",*pFloat);
return 0;
}
输出结果:
解析:
值为0.000000:
我们将9以整形的形式存储在内存中,其二进制为:0000 0000 0000 0000 0000 0000 0000 1001
首先,将 9 的⼆进制序列按照浮点数的形式拆分,得到第⼀位符号位s=0,后⾯8位的指数E=00000000 ,最后23位的有效数字M=000 0000 0000 0000 0000 1001。
由于指数E全为0,所以符合E为全0的情况。因此,浮点数V就写成:
V=(-1)^0 × 0.00000000000000000001001×2^(-126) =1.001×2^ (-146)
显然,V是⼀个很小的接近于0的正数,所以用十进制小数表示就是0.000000。
值为9.000000:
浮点数9.0 等于⼆进制的1001.0,即换算成科学计数法是:1.001×2^3
所以: 9.0 = (−1)^0 * (1.001) ∗ 2^3
所以,写成⼆进制形式,S+E+M,即
0 10000010 001 0000 0000 0000 0000 0000
这个32位的⼆进制数,被当做整数来解析的时候,就是整数在内存中的补码,符号位为0,所以是正的整数,所以补码就是原码,所以值就为1091567616