C语言再学习 -- 浮点数

最新推荐文章于 2024-06-19 10:46:24 发布

聚优致成

最新推荐文章于 2024-06-19 10:46:24 发布

阅读量2.7k

点赞数 7

分类专栏： C语言再学习

本文链接：https://blog.csdn.net/qq_29350001/article/details/52276370

版权

C语言再学习同时被 2 个专栏收录

86 篇文章 108 订阅

订阅专栏

C语言再学习

62 篇文章 248 订阅

订阅专栏

参考：

你应该知道的浮点数基础知识

浮点数的表示

浮点数的表示和基本运算

单精度浮点float：可以精确到小数点后6位

双精度浮点double：可以精确到小数点后12位

C可以通过f或F后缀是编译器把浮点常量当做float类型，比如2.3f和9.11E9F。

l或L后缀使一个数字成为long double类型，比如54.3l和4.32e4L。

建议使用L后缀，因为字母l和数字1容易混淆

没有后缀的浮点常量为double类型。（重点）。例：sizeof(1.9) = 8;

数据类型和占位符之间的对应关系：

float%f/%g
double %lf/%lg

%f和%lf会保留小数点后面多余的0 如 3.1400000 .2%f得 3.14

%g和%lg不会保留如 3.14

在浮点数比较中不能使用<和>，千万要留意，无论是float还是double类型的变量，都有精度限制。所以一定要避免将浮点变量用“==”或“！=”与数字比较，应该设法转化成“>=”或“<=”形式。

请写出 float x与“零值”比较的if语句

const float EPSINON = 0.000001;
if ((x >= - EPSINON) && (x <= EPSINON)

或者 if ( fabs(x) <=EPSINON)

// fabs(x)取x的绝对值，其中EPSINON是允许的误差（即精度）。

复习浮点数的二进制转换

我们先来看下浮点数二进制表达的三个组成部分。

三个主要成分是：

Sign（1bit）：表示浮点数是正数还是负数。0表示正数，1表示负数
Exponent（8bits）：指数部分。类似于科学技术法中的M*10^N中的N，只不过这里是以2为底数而不是10。需要注意的是，这部分中是以2^7-1即127，也即01111111代表2^0，转换时需要根据127作偏移调整。
Mantissa（23bits）：基数部分。浮点数具体数值的实际表示。

下面我们来看个实际例子来解释下转换过程。
Step 1 改写整数部分
以数值5.2为例。先不考虑指数部分，我们先单纯的将十进制数改写成二进制。
整数部分很简单，5.即101.。

Step 2 改写小数部分
小数部分我们相当于拆成是2^-1一直到2^-N的和。例如：
0.2 = 0.125+0.0625+0.007825+0.00390625即2^-3+2^-4+2^-7+2^-8….，也即.00110011001100110011

Step 3 规格化
现在我们已经有了这么一串二进制101.00110011001100110011。然后我们要将它规格化，也叫Normalize。其实原理很简单就是保证小数点前只有一个bit。于是我们就得到了以下表示：1.0100110011001100110011 * 2^2。到此为止我们已经把改写工作完成，接下来就是要把bit填充到三个组成部分中去了。

Step 4 填充
指数部分（Exponent）：之前说过需要以127作为偏移量调整。因此2的2次方，指数部分偏移成2+127即129，表示成10000001填入。
整数部分（Mantissa）：除了简单的填入外，需要特别解释的地方是1.010011中的整数部分1在填充时被舍去了。因为规格化后的数值整部部分总是为1。那大家可能有疑问了，省略整数部分后岂不是1.010011和0.010011就混淆了么？其实并不会，如果你仔细看下后者：会发现他并不是一个规格化的二进制，可以改写成1.0011 * 2^-2。所以省略小数点前的一个bit不会造成任何两个浮点数的混淆。
具体填充后的结果见下图