【QT】float double的范围与精度及Qt中的qfloat16

1、格式

float和double都是浮点数据类型,前者为单精度占四个字节,后者为双精度占八个字节。浮点数的存储格式采用IEEE标准,float包括1个符号位、8个指数位和23个尾数位,double包括1个符号位、11个指数位和52个尾数位,其中符号位表示正负,为1时表示负数,为0时表示正数。

2、范围

浮点数的范围由指数决定,以float为例,指数共8个二进制位,以无符号形式存储,指数范围为0~255,但实际的指数值需要减去127,也就是说实际的指数范围为-127~128,其中负指数决定了浮点数绝对值最小的非零值,正指数决定了浮点数绝对值的最大值即取值范围,所以float的范围为-2^128~2^128,换算成十进制科学计数法为-3.40e+38~3.40e+38。同理,double的指数范围为-1023~1024,取值范围为-2^1024~2^1024,即-1.79e+308~1.79e+308。另外,浮点数的最小值可以说是几乎等于0,无限接近于0但不等于0,float和double的最小值理论上是不等的。

3、精度

浮点数的精度由尾数决定,由于是以科学记数法存储的,所以整数部分总是隐含着一个1但对精度没有影响,以float为例,尾数共23个二进制位,2^23=8388608,共7位,所以精度为6~7位有效数字。同理,double的2^52=4503599627370496共16位,所以精度为15~16位有效数字。

4、例子

下面是float的一个例子。

十进制 -5.625 = 十六进制 C0B4 0000
转换成二进制为
1100 0000 1011 0100 0000 0000 0000 0000
按照浮点数格式(1个符号位+8个指数位+23个尾数位)划分为
1 1000 0001 01101 000000000000000000
其中,符号1表示负数;
指数1000 0001即129,减去127为2; 
尾数01101 000000000000000000即01101,加上隐含的整数部分为1.101101。
所以,最后的结果
= -1.01101 × 2^2
= -(1*2^0 + 1*2^(-2) + 1*2^(-3) + 1*2^(-5)) * 2^2
= -(1+0.25+0.125+0.03125) * 4
= -1.40625 * 4
= -5.625
 
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14

5、Qt

在Qt中,除了标准的数据类型包括浮点类型之外,还typedef了一些其它类型,其实就是给标准类型换个好认的名称而已。以qreal为例,在Qt中浮点类型用qreal表示,可能为float或double,如下所示:

#if defined(QT_COORD_TYPE)
typedef QT_COORD_TYPE qreal;
#else
typedef double qreal;
#endif
 
 
  • 1
  • 2
  • 3
  • 4
  • 5

Qt还提供了特殊的半精度浮点类型qfloat16,遵循IEEE754标准,1个符号位、5个指数位和10个尾数位,内部用quint16即unsigned short进行存储,如下所示:

class qfloat16
{
public:
#ifndef Q_QDOC
    Q_DECL_CONSTEXPR inline qfloat16() Q_DECL_NOTHROW : b16(0) { }
    inline qfloat16(float f) Q_DECL_NOTHROW;
    inline operator float() const Q_DECL_NOTHROW;
#endif

private:
    quint16 b16;

    Q_CORE_EXPORT static const quint32 mantissatable[];
    Q_CORE_EXPORT static const quint32 exponenttable[];
    Q_CORE_EXPORT static const quint32 offsettable[];
    Q_CORE_EXPORT static const quint32 basetable[];
    Q_CORE_EXPORT static const quint32 shifttable[];

    friend bool qIsNull(qfloat16 f) Q_DECL_NOTHROW;
    friend qfloat16 operator-(qfloat16 a) Q_DECL_NOTHROW;
};
 
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21

在对qfloat16进行处理时,通过重载的operator float()及static_cast把qfloat16转换成了float进行处理,根据其存储格式实现了如下几个函数:

bool qFuzzyCompare(qfloat16 p1, qfloat16 p2);
bool qIsFinite(qfloat16 f);
bool qIsInf(qfloat16 f);
bool qIsNaN(qfloat16 f);
qint64 qRound64(qfloat16 value);
int qRound(qfloat16 value);
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值