【C++复习四】浮点型数据double、float

最新推荐文章于 2024-01-25 22:30:52 发布

seuduck

最新推荐文章于 2024-01-25 22:30:52 发布

阅读量1.3k

点赞数

分类专栏： c++

本文链接：https://blog.csdn.net/seuduck/article/details/8742308

版权

9 篇文章 0 订阅

订阅专栏

以前呢，只知道double是双精度的，而float是单精度的，却没有深究是为什么，以及双精度和单精度都是指什么。

最近看了一些网上的解释，略有心得。

首先，探讨一下存储结构。

浮点数是以科学计数法存储的。科学计数法应该都知道的，不过电脑中一般都是用E或者e来表示10的幂。

例如

122.5=1.225*10e2；
0.01225=1.225*10e-2

还有采用了什么二进制浮点算法的 IEC 60559:1989 (IEEE 754) 标准，

符号位代表正负，正为0，负为1；指数位代表e后面的数字，尾数就是基数了，像上面的1.225就叫尾数。

指数偏移值是指在存储的时候指数需要加上一个偏移值，该标准规定偏移值为2^(e-1)-1;float就需要偏移128-1=127；

例如本来是6的话，存进去就是127+6=133；

尾数存储也有讲究，因为尾数总是等于1.xxxxx。所以计算机中只存储小数点后面的部分。

举个例子就应该很好理解了

(120.5)十进制转换成二进制就是1111000.1，科学计数法表示就是1.1110001*（2^6），所以符号位是0，指数位是127+6=133；尾数位就是1110001，不足的用0补齐。

float的表示法就是

float	4	3.4E +/- 38 (7 digits)
double	8	1.7E +/- 308 (15 digits) <—这个指15 个十进制位

还有就是浮点数比较是否相等的问题了，因为表示方法的问题，有可能1.0会被表示成0.9999999999或者1.00000000001什么的，建议的方法是定义一个两个值之间可以接受的误差，例如0.000000000001；

关注