浮点数在计算机内存中是如何存储的?

原创 2013年12月04日 18:16:36

对于一个整数,我们可以很方便的在十进制与二进制中转换,但是对于一个浮点数来说不是这么容易——因为小数点的存在。对于浮点数来说,小数点的位置不是固定的(小数点后面的数的个数不定),所以如何存储小数点是一个挑战。后来人们想出用科学计数法通常如这般:3.12*10^5来表示浮点数,这样的好处是:小数点的位置固定下来了。因为计算机只能用01表示,所以我们用2来表示上面提到的那个10.

公式如下:
                              X = a  *  2
e 
a为浮点数的二进制表示,范围为[1,2) ;

e为小数点移动的位数;

如:27.0表示成二进制为:11011.0,用科学计数法表示为1.10110*2^4.



那么如何存储1.10110*2^4这个数呢?

对于float型数据,其长度是4个字节,右边23位用来表示小数点后面的数字,中间8位用来表示e,左边一位用来表示正负。

对于double型数据,其长度是8个字节,右边52位用来表示小数点后面的数字.中间11位表示e,左边一位用来表示正负。如下图:

指数偏移量=2^(k-1),k为指数位个数。

因为e可以为正,可以为负数。比如1.10110*2^4 这个e为正数,如果是0.101那么用指数表示就是1.01*2^-1,那么e为-1。同时要求先把e+指数偏移量,得到的结果再化成二进制,就是我们的指数位。

小数部分:把小数点后面的数字。如上面的10110,位数不够就补零。

符号位:1表示负数,0表示正数


举例子:

27.5的二进制为11011.1

1.10111*2^4

尾数(小数点后的数)10111,补够23位 1011 1000 0000 0000 0000 000

指数:4,加上127,就是131,二进制1000 0011

用二进制表示就是 (符号数位1位)0 (指数位8位)1000 0011 (尾数位23位)1011 1000 0000 0000 0000 000

写成二进制标准形式:0100 0001 1101 1100 0000 0000 0000 0000

写成16进制就是41 DC 00 00

那么如何从二进制形式求出相应的十进制数呢?
先可以找出小数部分,指数位,以及符号位
1.通过符号位判断正负
2.算出指数位代表的十进制,把这个十进制减去指数偏移量2^(k-1),结果为正表明小数点往右边便宜e位,负则左边。
3小数部分有1,因为都有,可以不需要在计算机中存储,在这要表示出来结果是1.小数部分,如果e为正数,则把小数点往右边移动e位,负则是左边

举例子:
0x3fc00000

符号位:0  //说明是正数。    
指数位:011 1111 1   //偏移0
小数位:100 0000 0000 0000 0000 0000,-->1.10000000000000000000000为1.5
而按照规定,小数点前还隐含包括1,而这个1是不储存的,所以小数位实际是1.5,当偏移大于0时,小数点向右偏移相应的值,反之向左偏移相应的值。

0x40c00000
符号位:0    //说明是正数。    
指数位:100 0000 1  //偏移2

小数位:100 0000 0000 0000 0000 0000,
由于偏移为2,1.100 0000 0000 0000 0000 0000变成了110.0 0000 0000 0000 0000 0000 所以0x40c00000值为6
我们可以明白double变量的内存布局了。由于小数位的计算方式比如11.11111...在计算时为 1*2^1+1*2^0+1*2^(-1)+1*2^(-2)....可以看出在表示小数时,flaot的值不是连续的,事实上浮点数,以IEEE标准所能精确表示的仅仅是其中的一部分。

—————————————————————————————————————————————————————————————————————————————
转:

浮点数的二进制表示


1.

前几天,我在读一本C语言教材,有一道例题:

  #include <stdio.h>

  void main(void){

    int num=9; /* num是整型变量,设为9 */

    float* pFloat=&num; /* pFloat表示num的内存地址,但是设为浮点数 */

    printf("num的值为:%d\n",num); /* 显示num的整型值 */

    printf("*pFloat的值为:%f\n",*pFloat); /* 显示num的浮点值 */

    *pFloat=9.0; /* 将num的值改为浮点数 */

    printf("num的值为:%d\n",num); /* 显示num的整型值 */

    printf("*pFloat的值为:%f\n",*pFloat); /* 显示num的浮点值 */

  }

运行结果如下:

  num的值为:9
  *pFloat的值为:0.000000
  num的值为:1091567616
  *pFloat的值为:9.000000

我很惊讶,num和*pFloat在内存中明明是同一个数,为什么浮点数和整数的解读结果会差别这么大?

要理解这个结果,一定要搞懂浮点数在计算机内部的表示方法。我读了一些资料,下面就是我的笔记。

2.

在讨论浮点数之前,先看一下整数在计算机内部是怎样表示的。

  int num=9;

上面这条命令,声明了一个整数变量,类型为int,值为9(二进制写法为1001)。普通的32位计算机,用4个字节表示int变量,所以9就被保存为00000000 00000000 00000000 00001001,写成16进制就是0x00000009。

那么,我们的问题就简化成:为什么0x00000009还原成浮点数,就成了0.000000?

3.

根据国际标准IEEE 754,任意一个二进制浮点数V可以表示成下面的形式:

  

  (1)(-1)^s表示符号位,当s=0,V为正数;当s=1,V为负数。

  (2)M表示有效数字,大于等于1,小于2。

  (3)2^E表示指数位。

举例来说,十进制的5.0,写成二进制是101.0,相当于1.01×2^2。那么,按照上面V的格式,可以得出s=0,M=1.01,E=2。

十进制的-5.0,写成二进制是-101.0,相当于-1.01×2^2。那么,s=1,M=1.01,E=2。

IEEE 754规定,对于32位的浮点数,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。

对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。

5.

IEEE 754对有效数字M和指数E,还有一些特别规定。

前面说过,1≤M<2,也就是说,M可以写成1.xxxxxx的形式,其中xxxxxx表示小数部分。IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字。

至于指数E,情况就比较复杂。

首先,E为一个无符号整数(unsigned int)。这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,E的真实值必须再减去一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。

比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

然后,指数E还可以再分成三种情况:

(1)E不全为0或不全为1。这时,浮点数就采用上面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。

(2)E全为0。这时,浮点数的指数E等于1-127(或者1-1023),有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于0的很小的数字。

(3)E全为1。这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s);如果有效数字M不全为0,表示这个数不是一个数(NaN)。

6.

好了,关于浮点数的表示规则,就说到这里。

下面,让我们回到一开始的问题:为什么0x00000009还原成浮点数,就成了0.000000?

首先,将0x00000009拆分,得到第一位符号位s=0,后面8位的指数E=00000000,最后23位的有效数字M=000 0000 0000 0000 0000 1001。

由于指数E全为0,所以符合上一节的第二种情况。因此,浮点数V就写成:

  V=(-1)^0×0.00000000000000000001001×2^(-126)=1.001×2^(-146)

显然,V是一个很小的接近于0的正数,所以用十进制小数表示就是0.000000。

7.

再看例题的第二部分。

请问浮点数9.0,如何用二进制表示?还原成十进制又是多少?

首先,浮点数9.0等于二进制的1001.0,即1.001×2^3。

那么,第一位的符号位s=0,有效数字M等于001后面再加20个0,凑满23位,指数E等于3+127=130,即10000010。

所以,写成二进制形式,应该是s+E+M,即0 10000010 001 0000 0000 0000 0000 0000。这个32位的二进制数,还原成十进制,正是1091567616。

相关文章推荐

【转】线索二叉树的原理以及创建和遍历

这是一篇非常好的关于线索二叉树的文章,内容详细到位,叙述清晰。作者是以为很认真、信息的人,估计花了不少时间和精力,向作者致敬! 引用地址:http://waret.iteye.com/blog/70...

浮点数在计算机内存中的存储格式

浮点数在计算机内存中的存储格式 对于浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储,float数据占用32bit,double数据占用 64bit,我们在声明一个变...
  • todayq
  • todayq
  • 2011年08月18日 16:19
  • 638

浮点数在计算机中存储的方式

浮点数在计算机中的存储1996年6月4日,欧洲最新的无人驾驶火箭Ariane5初次航行时,发射后仅37秒,火箭偏离了它的飞行路径,解体并且爆炸。火箭上载有价值5亿美元的通信卫星。科学家们进行调查之后,...

一道面试题引发的问题:浮点数和整数在计算机种的存储方式

1.先看题目:     给出下面代码的输出:    float a = 1.0f; cout

浮点数在计算机中存储方式float,double)---转

 C语言和C#语言中,对于浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储,float数据占用32bit,double数据占用64bit,我们在声明一个变量float f=...

浮点数在计算机中存储方式

转自 http://blog.csdn.net/wuna66320/article/details/1691734#comments http://cruih.iteye.com/blog/127...

数据在计算机中的存储(字节序,浮点数)

1.大小端模式(字节序) 大小端的概念:数在内存中分字节存储的先后顺序。大端模式即数的低位存在高地址,高位存在低地址当中。而小端模式相反,低位存在低地址,高位存在高地址。比如0x1234,这里的...

计算机中浮点数的存储方式

参考网址:http://blog.chinaunix.net/uid-28458801-id-3507427.html 根据国际标准IEEE 754,任意一个二进制浮点数V可以表示成下面的形式: ...
  • AlphaGQ
  • AlphaGQ
  • 2017年07月11日 20:35
  • 135

浮点数在计算机中存储方式(转)

今天深入学习了一下浮点数在计算机的存储方式,下面文章将的比较好,但关于指数的存储没看懂,于是百度了另一篇,给了我教好的讲解,地址 http://blog.csdn.net/nethibernate/...
  • invLong
  • invLong
  • 2015年03月19日 09:51
  • 580

计算机中整数和浮点数的表示和存储【大端小端的区别】

整数的表示当前较为流行的有2种。 补码计数法 余码计数法补码计数法在补码计数法中用最高位表示符号位,如果最高位为1那么表示负数,如果最高位是0,那么表示非负数。 举例说明: 大部分计算机都是32位...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:浮点数在计算机内存中是如何存储的?
举报原因:
原因补充:

(最多只允许输入30个字)