实数的存储方式分为定点实数和浮点实数存储方式,定点实数就是约定好整数位和小数位的长度,比如用4字节存储实数,可以约定两个高字节存放整数部分,两个低字节存储小数部分,这样的好处是计算的效率高,缺点就是存储不灵活,整数的存储范围受限,如果要存储65536.0就不可以了。但是在一些条件恶劣的嵌入式开发场合,仍可看到定点实数的存储和使用。浮点实数就是用一部分二进制位存放小数点的位置信息,称之为“指数域”,其他部分存储没有小数点的数据和符号,称为“数据域”、“符号域”。
在C++中,使用浮点方式存储实数,有两种数据类型:float(4字节)和double(8字节),也分为有符号和无符号两类。浮点类型并不是将一个浮点小数直接转换为二进制保存,而是将浮点小数转换成的二进制码重新编码,在进行存储。浮点数的操作不会用到通用寄存器,而会使用浮点协处理器的浮点寄存器。浮点数编码转换采用的是IEEE规定的编码标准,float和double的转换原理相同,但是表示的范围不一样,编码方式有些许区别,IEEE规定的浮点数编码会将一个浮点数转换为二进制数,以科学计数法划分,拆分为3部分:符号,指数和尾数。
1. float编码原理
float最高位是符号位,后面8位表示指数位,最后的23位表示尾数。下面以12.25f为例,阐明转换为二进制的过程。