很抱歉,因为sf不支持行内公式,所以只能使用行间公式,导致格式有点难看。
引言
目前流行都是上层的语言和框架,通常情况下其实我们并不需要去了解底层实现。但有时候我们会遇到一些奇怪的错误,不了解底层实现的话就无法想通。
比如下面一个C的例子#include
int main(int argc, char** argv)
{
int num=8;
float* pfnum = #
printf("num = %d\n", num);
printf("*pfnum = %f\n", *pfnum);
*pfnum = 8.0;
printf("num = %d\n", num);
printf("*pfnum = %f\n", *pfnum);
return 0;
}
输出结果为num = 8
*pfnum = 0.000000
num = 1090519040
*pfnum = 8.000000
另外一个有趣的应用是计算2的74次方,很明显64位系统上只能表示到2的64次方
但下面的例子可以得到#include
#include
int main(int argc, char** argv)
{
printf(" num = %f\n", pow(2, 74));
return 0;
}
输出是num = 18889465931478580854784.000000
要理解以上问题,那我们就需要对浮点在底层的实现有一定了解
总述
IEEE754是IEEE二进制浮点算术标准。这个标准定义了表示浮点数的常规值与非规格化值(denormal number),一些特殊值(infinity)和非数值(NaN), 以及这些数值的浮点运算。另外它还规定了运算结果的近似原则和例外状况(包括例外发生的时机和处理方式).
虽然IEEE754只定义了单精度(32位),双精度(64位),扩展单精度(43位以上),与扩展单精度(79位以上)。但实现上它的定义法可以扩展到任意精度。所以下面的公式尽量针对任意精度。
格式
作为对比,我们先列出实数表示法msb...lsbn-1........................0
下面是浮点表示法SignExponentFraction(e+f)(e+f-1)......f(