关闭

浮点数在计算机内存中是如何存储的?

标签: 浮点数内存计算机表示
2431人阅读 评论(0) 收藏 举报
分类:

对于一个整数,我们可以很方便的在十进制与二进制中转换,但是对于一个浮点数来说不是这么容易——因为小数点的存在。对于浮点数来说,小数点的位置不是固定的(小数点后面的数的个数不定),所以如何存储小数点是一个挑战。后来人们想出用科学计数法通常如这般:3.12*10^5来表示浮点数,这样的好处是:小数点的位置固定下来了。因为计算机只能用01表示,所以我们用2来表示上面提到的那个10.

公式如下:
                              X = a  *  2
e 
a为浮点数的二进制表示,范围为[1,2) ;

e为小数点移动的位数;

如:27.0表示成二进制为:11011.0,用科学计数法表示为1.10110*2^4.



那么如何存储1.10110*2^4这个数呢?

对于float型数据,其长度是4个字节,右边23位用来表示小数点后面的数字,中间8位用来表示e,左边一位用来表示正负。

对于double型数据,其长度是8个字节,右边52位用来表示小数点后面的数字.中间11位表示e,左边一位用来表示正负。如下图:

指数偏移量=2^(k-1),k为指数位个数。

因为e可以为正,可以为负数。比如1.10110*2^4 这个e为正数,如果是0.101那么用指数表示就是1.01*2^-1,那么e为-1。同时要求先把e+指数偏移量,得到的结果再化成二进制,就是我们的指数位。

小数部分:把小数点后面的数字。如上面的10110,位数不够就补零。

符号位:1表示负数,0表示正数


举例子:

27.5的二进制为11011.1

1.10111*2^4

尾数(小数点后的数)10111,补够23位 1011 1000 0000 0000 0000 000

指数:4,加上127,就是131,二进制1000 0011

用二进制表示就是 (符号数位1位)0 (指数位8位)1000 0011 (尾数位23位)1011 1000 0000 0000 0000 000

写成二进制标准形式:0100 0001 1101 1100 0000 0000 0000 0000

写成16进制就是41 DC 00 00

那么如何从二进制形式求出相应的十进制数呢?
先可以找出小数部分,指数位,以及符号位
1.通过符号位判断正负
2.算出指数位代表的十进制,把这个十进制减去指数偏移量2^(k-1),结果为正表明小数点往右边便宜e位,负则左边。
3小数部分有1,因为都有,可以不需要在计算机中存储,在这要表示出来结果是1.小数部分,如果e为正数,则把小数点往右边移动e位,负则是左边

举例子:
0x3fc00000

符号位:0  //说明是正数。    
指数位:011 1111 1   //偏移0
小数位:100 0000 0000 0000 0000 0000,-->1.10000000000000000000000为1.5
而按照规定,小数点前还隐含包括1,而这个1是不储存的,所以小数位实际是1.5,当偏移大于0时,小数点向右偏移相应的值,反之向左偏移相应的值。

0x40c00000
符号位:0    //说明是正数。    
指数位:100 0000 1  //偏移2

小数位:100 0000 0000 0000 0000 0000,
由于偏移为2,1.100 0000 0000 0000 0000 0000变成了110.0 0000 0000 0000 0000 0000 所以0x40c00000值为6
我们可以明白double变量的内存布局了。由于小数位的计算方式比如11.11111...在计算时为 1*2^1+1*2^0+1*2^(-1)+1*2^(-2)....可以看出在表示小数时,flaot的值不是连续的,事实上浮点数,以IEEE标准所能精确表示的仅仅是其中的一部分。

—————————————————————————————————————————————————————————————————————————————
转:

浮点数的二进制表示


1.

前几天,我在读一本C语言教材,有一道例题:

  #include <stdio.h>

  void main(void){

    int num=9; /* num是整型变量,设为9 */

    float* pFloat=&num; /* pFloat表示num的内存地址,但是设为浮点数 */

    printf("num的值为:%d\n",num); /* 显示num的整型值 */

    printf("*pFloat的值为:%f\n",*pFloat); /* 显示num的浮点值 */

    *pFloat=9.0; /* 将num的值改为浮点数 */

    printf("num的值为:%d\n",num); /* 显示num的整型值 */

    printf("*pFloat的值为:%f\n",*pFloat); /* 显示num的浮点值 */

  }

运行结果如下:

  num的值为:9
  *pFloat的值为:0.000000
  num的值为:1091567616
  *pFloat的值为:9.000000

我很惊讶,num和*pFloat在内存中明明是同一个数,为什么浮点数和整数的解读结果会差别这么大?

要理解这个结果,一定要搞懂浮点数在计算机内部的表示方法。我读了一些资料,下面就是我的笔记。

2.

在讨论浮点数之前,先看一下整数在计算机内部是怎样表示的。

  int num=9;

上面这条命令,声明了一个整数变量,类型为int,值为9(二进制写法为1001)。普通的32位计算机,用4个字节表示int变量,所以9就被保存为00000000 00000000 00000000 00001001,写成16进制就是0x00000009。

那么,我们的问题就简化成:为什么0x00000009还原成浮点数,就成了0.000000?

3.

根据国际标准IEEE 754,任意一个二进制浮点数V可以表示成下面的形式:

  

  (1)(-1)^s表示符号位,当s=0,V为正数;当s=1,V为负数。

  (2)M表示有效数字,大于等于1,小于2。

  (3)2^E表示指数位。

举例来说,十进制的5.0,写成二进制是101.0,相当于1.01×2^2。那么,按照上面V的格式,可以得出s=0,M=1.01,E=2。

十进制的-5.0,写成二进制是-101.0,相当于-1.01×2^2。那么,s=1,M=1.01,E=2。

IEEE 754规定,对于32位的浮点数,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。

对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。

5.

IEEE 754对有效数字M和指数E,还有一些特别规定。

前面说过,1≤M<2,也就是说,M可以写成1.xxxxxx的形式,其中xxxxxx表示小数部分。IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字。

至于指数E,情况就比较复杂。

首先,E为一个无符号整数(unsigned int)。这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,E的真实值必须再减去一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。

比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

然后,指数E还可以再分成三种情况:

(1)E不全为0或不全为1。这时,浮点数就采用上面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。

(2)E全为0。这时,浮点数的指数E等于1-127(或者1-1023),有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于0的很小的数字。

(3)E全为1。这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s);如果有效数字M不全为0,表示这个数不是一个数(NaN)。

6.

好了,关于浮点数的表示规则,就说到这里。

下面,让我们回到一开始的问题:为什么0x00000009还原成浮点数,就成了0.000000?

首先,将0x00000009拆分,得到第一位符号位s=0,后面8位的指数E=00000000,最后23位的有效数字M=000 0000 0000 0000 0000 1001。

由于指数E全为0,所以符合上一节的第二种情况。因此,浮点数V就写成:

  V=(-1)^0×0.00000000000000000001001×2^(-126)=1.001×2^(-146)

显然,V是一个很小的接近于0的正数,所以用十进制小数表示就是0.000000。

7.

再看例题的第二部分。

请问浮点数9.0,如何用二进制表示?还原成十进制又是多少?

首先,浮点数9.0等于二进制的1001.0,即1.001×2^3。

那么,第一位的符号位s=0,有效数字M等于001后面再加20个0,凑满23位,指数E等于3+127=130,即10000010。

所以,写成二进制形式,应该是s+E+M,即0 10000010 001 0000 0000 0000 0000 0000。这个32位的二进制数,还原成十进制,正是1091567616。

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:52789次
    • 积分:1055
    • 等级:
    • 排名:千里之外
    • 原创:52篇
    • 转载:3篇
    • 译文:0篇
    • 评论:3条
    博客专栏
    最新评论