目前大多数高级语言(包括C)都按照IEEE-754标准来规定浮点数的存储格式,IEEE754规定,单精度浮点数用4字节存储,双精度浮点数用8字节 存储,分为三个部分:符号位、阶和尾数。阶即指数,尾数即有效小数位数。单精度格式阶占8位,尾数占24位,符号位1位,双精度则为11为阶,53位尾数 和1位符号位,如下图所示:
s | 指数 | 尾数 |
31 | 30 23 | 22 0
符号位1bit 阶数8bits 尾数23bits(规格化后可以表示24bits)
s | 指数 | 尾数 |
63 | 62 52 | 51 0
符号位1bit 阶数11bits 尾数52bits(规格化后可以表示53bits)
细心的人会发现,单双精度各部分所占字节数量比实际存储格式都了一位,的确是这样,事实是,尾数部分包括了一位隐藏位,允许只存储23位就可以表示24位 尾数,默认的1位是规格化浮点数的第一位,当规格化一个浮点数时,总是调整它使其值大于等于1而小于2,亦即个位总是为1。例如1100B,对其规格化的 结果为1.1乘以2的三次方,但个位1并不存储在23位尾数部分内,这个1是默认位。
阶以移码的形式存储。对于单精度浮点数,偏移量为127(7FH),而双精度的偏移量为1023(3FFH)。存储浮点数的阶码之前,偏移量要先加到阶码 上。前面例子中,阶为2的三次方,在单精度浮点数中,移码后的结果为127+3即130(82H),双精度为1026(402H)。
浮点数有两个例外。数0.0存储为全零。无限大数的阶码存储为全1,尾数部分全零。符号位指示正无穷或者负无穷。
下面举几个例子:
十进制 | 规格化 | 符号 | 移阶码 | 尾数 |
-12 | -1.1x23 | 1 | 10000010 | 1000000 00000000 00000000 |
0.25 | 1.0x2-2 | 0 | 01111101 | 0000000 00000000 00000000 |
所有字节在内存中的排列顺序,intel的cpu按little endian顺序,motorola的cpu按big endian顺序排列。