float为什么不精确

二进制的限制

二进制的小数 就是形如 101.11 数字。
101.11 就等于 1 * 2^2 +0 2^1 + 12^0 + 12^-1 + 12^-2 = 4+0+1+1/2+1/4 = 5.75 。
对于二进制小数,小数点右边能表达的值是 1/2, 1/4, 1/8, 1/16, 1/32, 1/64, 1/128 … 1/(2^n),计算机只能用这些个 1/2^n 之和来表示十进制的小数。而这种和值并不能表示出所有小数。

例如表示十进制的 0.2 :
0.01 = 1/4 = 0.25 ,太大

0.001 =1/8 = 0.125 , 又太小

0.0011 = 1/8 + 1/16 = 0.1875 , 逼近0.2了

0.00111 = 1/8 + 1/16 + 1/32 = 0.21875 , 又大了

0.001101 = 1/8+ 1/16 + 1/64 = 0.203125 还是大

0.0011001 = 1/8 + 1/16 + 1/128 = 0.1953125 差不多

0.00110011 = 1/8+1/16+1/128+1/256 = 0.19921875
已经很逼近了, 就这样吧。
这就是我说的用二进制小数没法精确表达10进制小数。

在计算机中的表示

计算机不可能提供无限的空间让程序去存储这些二进制小数。

它需要规定长度, 在Java 中, 提供了两种方式: float 和double , 分别是32位和64位。

可以这样查看一下一个float的内部表示(以0.09f为例):
Float.floatToRawIntBits(0.09f)

将会得到:1035489772, 这是10进制的, 转化成二进制, 在前面加几个0补足 32位就是:

0 01111011 01110000101000111101100

可以看到它分成了3段:
第一段代表了符号(s) : 0 正数, 1 负数 , 其实更准确的表达是 (-1) ^0

第二段是阶码(e):01111011  ,对应的10进制是 123

第三段是尾数(M)

其中的尾数和阶码,这其实是所谓的科学计数法:
(-1)^s * M * 2^e

对于0.09f 的例子,就是:
0101110000101000111101100 * (2^123)
好像不对,这肯定远远大于0.09f !

这是因为浮点数遵循的是IEEE754 表示法, 刚才的s(符号) 是对的,但是 e(阶码)和 M(尾数)需要变换:

对于阶码e , 一共有8位, 这是个有符号数, 特别是按照IEEE754 规范, 如果不是0或者255, 那就需要减去一个叫偏置量的值,对于float 是127

所以 E = e - 127 = 123-127 = -4

对于尾数M ,如果阶码不是0或者255, 他其实隐藏了一个小数点左边的一个 1 (节省空间,充分压榨每一个bit)。
即 M = 1.01110000101000111101100

现在写出来就是:
1.01110000101000111101100 * 2^-4
=0.000101110000101000111101100
= 1/16 + 1/64 + 1/128+ 1/256 + …
= 0.0900000035762786865234375

这就是0.09的内部表示, 很明显他比0.09更大一些, 是不精确的!

64位的双精度浮点数double是也是类似的, 只是尾数和阶码更长, 能表达的范围更大。
符号位 :1位
阶码 : 11位
尾数: 52位

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值