运行下述代码段:
double value = 99999999.99;
double sum = 0.0;
for(int i=0;i<8192;i++)
{
sum += value; // 错误的浮点累加方法
}
printf("%18.2lf", sum); // 819199999918.02 --wrong
运行结果,sum是错误的, 和正确值相差0.06(99999999.99 * 8192 = 819199999918.08),对于报表之类的高精度的项目数据统计,这是不能容忍的,循环越多误差越大。解决方法之一,可以用高精度算法库来代替,比如doubledouble类型,或选择微软的解决方法:本意是,浮点相加硬件实现是减法。把加法改成减法,把误差也计算进去。
上述代码修改后:
double value = 99999999.99;
double sum = 0.0;
double C=0, Y, T;
for(int i=0;i<8192;i++)
{
Y = value - C;
T = sum + Y;
C = T - sum - Y; // 正确的浮点累加方法,做减法。
sum = T;
}
printf("%18.2lf", sum);// 819199999918.08 --correct
加了误差累计,这样结果就正确了。还有浮点运算法则最重要一点,是不符合实数算法相同的代数规则。 (sum+Y)-sum-Y ,结果是不等于零的。
参考:
http://msdn.microsoft.com/en-us/library/aa289157(VS.71).aspx
http://msdn.microsoft.com/en-us/library/aa289157(VS.71).aspx
http://www.cppblog.com/foxriver/archive/2009/02/28/75136.html