浮点数在计算机中的存储:
首先明确浮点数在计算机中同样使用二进制进行存储。首先先对浮点数进行分析,可以将浮点数分解为三部分:符号+数值+缩放因子
例如:0.00123(=1.23/10^3)可以描述为符号为+,数值为1.23,缩小10^3倍。使用这三个特点可以描述任意一个浮点数。
将浮点数转换成二进制编码的方式:IEEE754规则
- 浮点数V = (-1)^S * M * 2^E ,S为符号位,M为数值,E为缩放因子;其中M介于1~2之间。
对应到内存中的存储:
以32位的浮点数为例,32位的内存空间将这么划分给各个部分:符号(S:1位)数值(M:23位)指数(E:8位)。
C++中两种浮点数的书写方法:
- 常见的小数点方式:1.23……
- E表示法:1.23e+3
可以看出,可以十分直观的看出E表示法十分适合表示很大的数和很小的数,所以当整型很大无法用整型现有的类型来表述的时候,可以将其保存为浮点数。即使没有小数部分,只要使用了E表示法,统一将其保存为浮点数。
浮点数类型
和整型一样,浮点数同样拥有三种类型,float,double,long double;由于浮点型和整型在内存中的存储方式不同,其对于浮点数的存储规范也不一致。C++中对于浮点数的规范如下:
- float至少32位
- double至少48位且不少于float
- long double不少于double
- 指数域的范围至少是6位
不同的系统最终确定的长度不一致,具体取决于头文件cfloat或float.h;该头文件中包含了浮点数的最低有效位数,用于表示尾数的位数,以及指数范围。
同样的,我们可以通过添加后缀限定浮点数常量的类型,如f,l,或者直接使用E表示法。
- 1.23f
- 1.456l
- 4e-4
由于浮点数有缩放因子的存在,其能表示的范围要广得多,但同时,涉及到十进制向二进制转换,可能存在约数的情况,所以浮点数同比整数其精度有所下降,同时由于其特殊的保存方式,计算机处理浮点数的效率也会有所下降。