example1
用C语言编程:float x, y, z;使得x= 1.5×10^38^ ; y=1.5×10^38^ ; z=1.0; 计算(x + y)+z 与 x+(y + z) 的值分别是多少,两者是否相等?分析结果产生原因。
#include <stdio.h>
int main ( )
{
float x, y, z;
x = - 1.5e38 ;
y = 1.5e38 ;
z = 1.0 ;
printf ( "(x+y)+z=%f\n" , ( x+ y) + z) ;
printf ( "x+(y+z)=%f\n" , x+ ( y+ z) ) ;
return 0 ;
}
不相等。分析如下: (x+y)+z 先计算x+y即-1.5×1038+1.5×1038,此时x与y已对阶成功,计算结果为0.0,再计算0.0+1.0,结果得到1.0; x+(y+z) 先计算y+z,计算时要进行对阶操作,由于float机器码长度有限,根据IEEE754标准,单精度浮点数有最多24个有效数字,在对阶过程中要使得z的阶码与相同,则其尾数会被截断,这样实际参与运算的z被处理成0,自然这一步的计算结果就是1.5×1038;也就是说由于y与z大小差异很大,出现了大数吃小数的现象;再计算x与1.5×1038的和,对阶成功,结果为0。
example2
用C语言编程实现:简单累加 50 万个 0.1 的操作,查看结果是否等于 50000 。如果不等,分析结果产生原因。
#include <stdio.h>
int main ( )
{
float a = 0.1 ;
float sum = 0 ;
for ( int i= 0 ; i< 500000 ; i++ )
sum + = a;
printf ( "%f\n" , sum) ;
return 0 ;
}
发现50万个0.1相加的结果不是50000,而是50177.097656,产生较大的误差!原因分析如下: ① 10进制的0.1没有精确的二进制表示,只能取近似,因此在累加过程中0.1机器码与真值的误差会逐步累积 ② 累加次数多,随着加法的进行,第一个加数逐渐增大至与第二个加数0.1相差较大时,会出现对阶时有效位数不足的情况,就产生类似于实验任务1的情况。
example3
- 采用`Kahan累加算法`(降低浮点数累加误差)实现 50 万个0.1 累加,查看运行结果。
- Kahan算法主要思想:计算出每次累加所带来的舍入误差,并将其添加在下一次的加数上。
#include <stdio.h>
int main ( )
{
float a= 0.1 , sum= 0 , t, c= 0 , y;
for ( int i= 1 ; i<= 500000 ; i++ )
{
y = a- c;
t = sum+ y;
c= ( t- sum) - y;
sum= t;
}
printf ( "%f\n" , sum) ;
return 0 ;
}