1、格式
float和double都是浮点数据类型,前者为单精度占四个字节,后者为双精度占八个字节。浮点数的存储格式采用IEEE标准,float包括1个符号位、8个指数位和23个尾数位,double包括1个符号位、11个指数位和52个尾数位,其中符号位表示正负,为1时表示负数,为0时表示正数。
2、范围
浮点数的范围由指数决定,以float为例,指数共8个二进制位,以无符号形式存储,指数范围为0~255,但实际的指数值需要减去127,也就是说实际的指数范围为-127~128,其中负指数决定了浮点数绝对值最小的非零值,正指数决定了浮点数绝对值的最大值即取值范围,所以float的范围为-2^128~2^128,换算成十进制科学计数法为-3.40e+38~3.40e+38。同理,double的指数范围为-1023~1024,取值范围为-2^1024~2^1024,即-1.79e+308~1.79e+308。另外,浮点数的最小值可以说是几乎等于0,无限接近于0但不等于0,float和double的最小值理论上是不等的。
3、精度
浮点数的精度由尾数决定,由于是以科学记数法存储的,所以整数部分总是隐含着一个1但对精度没有影响,以float为例,尾数共23个二进制位,2^23=8388608,共7位,所以精度为6~7位有效数字。同理,double的2^52=4503599627370496共16位,所以精度为15~16位有效数字。
4、例子
下面是float的一个例子。
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
5、Qt
在Qt中,除了标准的数据类型包括浮点类型之外,还typedef了一些其它类型,其实就是给标准类型换个好认的名称而已。以qreal为例,在Qt中浮点类型用qreal表示,可能为float或double,如下所示:
- 1
- 2
- 3
- 4
- 5
Qt还提供了特殊的半精度浮点类型qfloat16,遵循IEEE754标准,1个符号位、5个指数位和10个尾数位,内部用quint16即unsigned short进行存储,如下所示:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
在对qfloat16进行处理时,通过重载的operator float()
及static_cast把qfloat16转换成了float进行处理,根据其存储格式实现了如下几个函数: