以前呢,只知道double是双精度的,而float是单精度的,却没有深究是为什么,以及双精度和单精度都是指什么。
最近看了一些网上的解释,略有心得。
首先,探讨一下存储结构。
浮点数是以科学计数法存储的。科学计数法应该都知道的,不过电脑中一般都是用E或者e来表示10的幂。
例如
122.5=1.225*10e2;
0.01225=1.225*10e-2
还有采用了什么二进制浮点算法的 IEC 60559:1989 (IEEE 754) 标准,
符号位 | 指数位 | 尾数位 | |
float | 1 | 8 | 23 |
double | 1 | 11 | 52 |
指数偏移值是指在存储的时候指数需要加上一个偏移值,该标准规定偏移值为2^(e-1)-1;float就需要偏移128-1=127;
例如本来是6的话,存进去就是127+6=133;
尾数存储也有讲究,因为尾数总是等于1.xxxxx。所以计算机中只存储小数点后面的部分。
举个例子就应该很好理解了
(120.5)十进制转换成二进制就是1111000.1,科学计数法表示就是1.1110001*(2^6),所以符号位是0,指数位是127+6=133;尾数位就是1110001,不足的用0补齐。
float的表示法就是
符号位 | 指数位 | 尾数位 |
0 | 1000 0101 | 111 0001 0000 0000 0000 |
0 | 127+6 | 1110001 |
float | 4 | 3.4E +/- 38 (7 digits) |
double | 8 | 1.7E +/- 308 (15 digits) <—这个指15 个十进制位 |
还有就是浮点数比较是否相等的问题了,因为表示方法的问题,有可能1.0会被表示成0.9999999999或者1.00000000001什么的,建议的方法是定义一个两个值之间可以接受的误差,例如0.000000000001;