C++ 浮点数的存储结构

浮点数 存储结构

IEEE的标准,浮点数的定义如下


符号位指数位小数部分指数偏移量
单精度浮点数1 位[31]8位 [30-23]23位 [22-00]127
双精度浮点数1 位[63]11 位[62-52]52 位[51-00]1023


我们以单精度浮点数来说明:

符号位,表述浮点数的正或者负

指数实际也有正负的,但是没有单独的符号位,而是采用了一个偏移来表示

在计算机的世界里,进位都是二进制的,指数表示的也是2的N次幂

这个数据格式当中的,指数是8位,可表达的范围是0到255,而对应的实际的指数是-127到+128。这里特殊说明,-127和+128这两个数据在IEEE当中是保留的用作多种用途的。-127表示的数字是0,128和其他位数组合表示多种意义,最典型的就是NAN状态。

小数部分,并不是一个浮点数的实际的小数。实际的小数在这个小数前面还保留了一个1。拿浮点数1.0来说,符号位是0, 实际指数是0,对应这里的指数就是127了,也就是0x7f。而小数部分就是1.0了, 1是暗含的不存储,实际的小数部分就是0了。因此组合起来的数据就是,0x3f80000 。

可以用一个类来表示:
class FloatType 
{
public:
      union {
         DWORD m_dwInt;
         float          m_fFloat;
       struct {  

        int    m_nFra: 23;

          int    m_nExp : 8;

          bool m_bSign : 1;

      };
};

两个浮点数大小比较的源码实现:

#include<iostream>
#include<stdio.h>
int main()
{
float f1 = 1.23; 
float f2 = 1.24;
std::cout<<((int&)f1 > (int&)f2)<<std::endl;
std::cout<<(int&)f1 <<std::endl;
std::cout<<(int&)f2 <<std::endl;
std::cout<<(int)f1 <<std::endl;
std::cout<<(int)f2 <<std::endl;
std::cout<<((int&)f1 - (int&)f2)<<std::endl;

return 0;
}


4.2.2 代码输出

0
1067282596
1067366482
1
1

-83886

4.3 原理阐释

对于两个正的浮点数,他们的大小比较就可以用 (int&)f1 - (int&)f2 来进行比较了。差值的结果实际上就应该是相对误差了,这个相对误差,不等同于普遍意义上的相对误差,它所表达的是,两个浮点数之间可能还有多少个可以精确表达的浮点数。这样通过指定这个阈值来控制两个浮点数的比较就更有效了。


对于两个正的浮点数
bool IsEqual(float f1, float f2, int absDelta)
{
if ( abs ( (int&)f1 - (int&)f2 ) < absDelta ) return true;
}


这里用abs而不是fabs这在asm上面的运算差距也是很大的了

对于两个负数进行比较的情况也是相同的。只不过负数内存对应的整数加1,相应的找到的是更小的负数而已

但是负数和整数之间现在还不能进行直接的比较,因为根据IEEE的内存结构,正数和负数是不同的,对应的整数不能连续。
正的最小的数就是0了,对应的整数也是0x00000000
负的最小的数就是-0,对应的整数则是0x 80000000

不用奇怪-0。在IEEE的表达当中是有两个0的,一个是 +0 一个是-0,有趣的是,按照 f1 == f2 的判断 +0和-0是相等的。

通过对比我们可以发现, +0 和正的浮点数可以按照转换成为整数的方式直接进行比较,-0 和负的浮点数可以按照转换成为整数的方式直接进行比较。如果我们能够把他们连接起来,整个整数方式的直接比较就完备了。


对比一下负数的结构, 可以找到一个简单的办法了:
把负数内存对应的整数减去 -0 ,他们就连续了
而且更好的结果是,所有的负数经过这次减法后,对应的整数也都是负数了
这样整个整数比较就变得连续了,而且在整个浮点数范围内都是有效的了

最后的比较算法就是:


// 函数: bool IsEqual(float f1, float f2, int absDelta)
// 功能:把比较两个浮点数是否近似相同
// 输入:f1, f2参与比较的两个浮点数
// absDelta 两个浮点数之间允许有多少个其他可以精确表达的浮点数存在,相当于相对误差
// 输出: true,两个浮点数进行相等; false 两个浮点数不等
// 注意:仅仅适合IEEE 32位浮点数结构


bool IsEqual(float f1, float f2, int absDelta)
{
int i1, i2;
i1 = ( f1>0) ? ((int&)f1) : ( (int&) f1 - 0x80000000 );
i2 = (f2>0) ? ((int&)f2) : ( (int&) f2 - 0x80000000 );
return ((abs(i1-i2))<absDelta) ? true : false;
}

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值