这里以float为例来说:
根据IEEE 754标准,float总共32位,其中第1位为符号位,接下来8位为指数位,最后的23位表示尾数。
我们以20014999这个数为例进行讲解:
由于这个数是一个整数所以首先将转换为二进制:20014999=1 0011 0001 0110 0111 1001 0111 总共25位。将其使用科学计数法表示,指数为24,将指数24加上127(移码,因为有些指数为负数,,为了更好的比较指数大小就将其转化为正数,即加127)最终就是指数位的二进制即1001 0111=151。 由于尾数位的最高位都为1所以我们将该位去掉即变成了0011 0001 0110 0111 1001 0111 但是我们发现这个数还剩24位,超过了我们所规定的的23位,这时候就必须进行四舍五入近似取值了,这也就是浮点数精度问题的关键所在,四舍五入去掉最后一位之后尾数就变成了0011 0001 0110 0111 1001 100 。最后将各个部分进行连接即2014999浮点数存储形式为0 10010111 00110001011001111001100
public class FloatDoubleTest3 {
public static void main(String[] args)
{
float f = 20014999;
int i = Float.floatToIntBits(f);
System.out.println(Integer.toBinaryString(i));
}
}
结果为:
1001011100110001011001111001100
可见分析过程是正确的,因为是正数所以加上0即
010010111
00110001011001111001100
接下来我们将对这个float进行二进制到十进制转换:
首先8位的指数为151减去127为24,所以指数为24.
将23位的尾数补上去掉的最高位1,即100110001011001111001100 根据科学计数法
即为1.0110001011001111001100 *2^24=1001100010110011110011000=20015000.这就是浮点数精度问题。
这里我们以整数来作为例子来讲解,也可以用123.456这种数来进行讲解,原理都是一样的只不过,由于有小数部分,所以除了将整数部分进行二进制转化外还需要对小数部分进行二进制转化,我们知道小数部分的二进制转化有可能是无限的,所以我们一般就与整数凑够23位即可,省略掉的小数部分就是缺失的那部分精度。