近期参与到了一个金融项目,开发十分的谨慎。先抛出我有问题的代码,作用是把以分为单位的金额转成以元为单位的字符串。
- 1
- 2
- 1
- 2
很自信的以为这行代码简洁明了的完成了使命。同事review了我的代码后,指出这段代码会造成精度丢失的问题。先演示一个demo,构造一个浮点数丢失精度的场景。
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
程序输出结果
- 1
- 2
- 3
- 1
- 2
- 3
输出结果足以颠覆三观。一个双精度浮点数,加了10亿之后,居然没有发生任何变化!如果在金融项目里发生这种事,何止是直接被fire掉,蹲监狱都是可能的。这类 问题其根本原因在于浮点数在计算机内部的表示方法。这种IEEE标准表示法兼顾了数据的精度和大小。
图片摘自网上。学过《计算机组成原理》的同学都知道,32位的浮点数由3部分组成:1比特的符号位,8比特的阶码(exponent,指数),23比特的尾数(Mantissa,尾数)。这个结构会表示成一个小数点左边为1,以底数为2的科学计数法表示的二进制小数。浮点数的能表示的数据大小范围由阶码决定,但是能够表示的精度完全取决于尾数的长度。long的最大值是2的64次方减1,需要63个二进制位表示,即便是double,52位的尾数也无法完整的表示long的最大值。不能表示的部分也就只能被舍去了。对于金额,舍去不能表示的部分,损失也就产生了。
了解了浮点数表示机制后,丢失精度的现象也就不难理解了。但是,这只是浮点数不能表示金额的原因之一。还有一个深刻的原因与 进制转换 有关。十进制的0.1在二进制下将是一个无线循环小数。同样,给出一个能体现这个问题的demo。
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
程序输出结果:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
10个浮点数0.1相加最后并没有得到1。如果一个小数不是2的负整数次幂,用浮点数表示必然产生浮点误差。做一次延伸,A进制下的有限小数,B进制下极有可能是无限小数。这种情形下,十进制小数转换成尾数长度固定的浮点数,误差也将产生。
综上,浮点数不精确的根本原因在于尾数部分的位数是固定的,一旦需要表示的数字的精度高于浮点数的精度,那么必然产生误差!这在处理金融数据的情况下是绝对不允许存在的。
对于金融项目,误差是不能容忍的。那么用什么数据类型才能精确的表示金额?JDK提供了一个BigDecimal的类,这个类可以表示任意精度的数字。有ACM经验的同学对这个类的底层实现应该不陌生,用int数组模拟大数。各大OJ平台都有长整数加减乘除的题目,八大基本数据类型都无法解决这类题目,唯一可行的解就是用数组模拟长整数。
不仅金融项目对浮点误差是零容忍的,国防军工航天项目亦是如此!1991的海湾战争,沙特的爱国者导弹因为浮点误差产生了0.3秒的误差,不仅没能拦截伊拉克的飞毛腿导弹,而且因为0.3秒的时间误差,导致了700余米的位移误差,炸毁了美军自己的军营,28名美国大兵出师未捷身先死,更讽刺的是死于浮点误差而非枪林弹雨(详见《CSAPP》修订版第二章习题32)。
回头再看自己犯的错误,不禁一身冷汗,这种代码要是上到正式环境了,恐怕会为公司带来不少的损失!优秀的程序员不会栽在同一个陷阱,把这个经验记下来,分享给大家。
能够快速的理解这个问题,也得益于本科时学习了当时认为对编程根本没卵用的《计算机组成原理》。修过的课程和阅读过的书,都在潜移默化的帮助你我写出鲁棒性更好的代码。