C语言 - 数据存储（浮点数存储）

Ameris Z

已于 2023-02-26 14:32:17 修改

阅读量406

点赞数 3

分类专栏： C语言文章标签： c++ 开发语言

于 2023-02-21 20:35:55 首次发布

本文链接：https://blog.csdn.net/weixin_55807049/article/details/129148041

版权

C语言专栏收录该内容

24 篇文章 4 订阅

订阅专栏

一、浮点数的存储规则

num 和 *pFloat 在内存中明明是同一个数，为什么浮点数和整数的解读结果会差别这么大？

要理解这个结果，一定要搞懂浮点数在计算机内部的表示方法。

详细解读：

根据国际标准 IEEE （电气和电子工程协会） 754 ，任意一个二进制浮点数 V 可以表示成下面的形式：

(-1)^S * M * 2^E
(-1)^S表示符号位，当S=0，V为正数；当S=1，V为负数。
M表示有效数字，大于等于1，小于2。
2^E表示指数位。

举例来说：

十进制的 5.0 ，写成二进制是 101.0 ，相当于 1.01×2^2 。

那么，按照上面V 的格式，可以得出 S=0 ， M=1.01 ， E=2 。

十进制的-5.0 ，写成二进制是 - 101.0 ，相当于 - 1.01×2^2 。那么， S=1 ， M=1.01 ， E=2 。

IEEE 754 规定：

对于32位的浮点数 ，最高的 1 位是符号位 s ，接着的 8 位是指数 E ，剩下的 23 位为有效数字 M 。

对于64位的浮点数，最高的1位是符号位S，接着的11位是指数E，剩下的52位为有效数字M。

IEEE 754对有效数字M和指数E，还有一些特别规定。

        前面说过， 1≤M<2 ，也就是说， M 可以写成 1.xxxxxx 的形式，其中 xxxxxx 表示小数部分。

        IEEE 754规定，在计算机内部保存M时，默认这个数的第一位总是1 ，因此可以被舍去，只保存后面的 xxxxxx部分。比如保存 1.01 的时候，只保存01 ，等到读取的时候，再把第一位的 1 加上去。这样做的目的，是节省 1 位有效数字。以 32 位浮点数为例，留给M 只有 23 位，将第一位的1 舍去以后，等于可以保存 24 位有效数字。

至于指数 E ，情况就比较复杂。

        首先，E 为一个无符号整数（ unsigned int ）

        这意味着，如果E 为 8 位，它的取值范围为 0~255 ；如果 E 为 11 位，它的取值范围为 0~2047 。但是，我们知道，科学计数法中的E 是可以出现负数的，所以IEEE 754 规定，存入内存时 E 的真实值必须再加上一个中间数，对于 8 位的 E ，这个中间数是127 ；对于 11 位的 E ，这个中间数是1023 。比如， 2^10 的 E 是 10 ，所以保存成 32 位浮点数时，必须保存成 10+127=137 ，即 10001001。

然后，指数E从内存中取出还可以再分成三种情况：

E不全为0或不全为1

这时，浮点数就采用下面的规则表示，即 指数E的计算值减去127（或1023） ，得到真实值， 再将有效数字M前加上第一位的1 。

比如：

0 10000001 00100000000000000000000

E为 10000001 十进制130

130-127=3 才是E的真实值

根据计算 ( - 1 ) ^0*1 . 001*2 ^3

E 全为 0

这时，浮点数的指数 E等于1-127（或者1-1023）即为真实值 ，

有效数字M不再加上第一位的1，而是还原为0.xxxxxx的小数 。这样做是为了表示 ±0 ，以及接近于

0 的很小的数字。

E 全为 1

这时，如果 有效数字M全为0，表示±无穷大 （正负取决于符号位 s ）

int main()
{
	int n = 9;
	//00000000000000000000000000001001 - 9的补码
	//
	//0 00000000 00000000000000000001001
	//E = 1-127 = -126  //当指数部分位全0时，E为1-127
	//M = 0.00000000000000000001001 当指数部分位全0时，M不再时1.xxxx而是0.xxxxxx
	//(-1)^0 * 0.00000000000000000001001 * 2^-126
	//所以得到0.000000

	float* pFloat = (float*)&n;

	printf("n的值为：%d\n", n);//9	//以整型方式存储，以整型方式输出，值不变
	printf("*pFloat的值为：%f\n", *pFloat);//0.000000   //以整型方式存储，以浮点型方式输出，值需要按照浮点型方式读取

	*pFloat = 9.0;//以浮点数的视角，存放浮点型的数字
	//1001.0  - 二进制
	//1.001 * 2^3 
	//(-1)^0 * 1.001 * 2^3
	//S=0
	//E=3
	//M=1.001
	//0 10000010 00100000000000000000000 - 浮点数存储形式
	//整型读取会看作  
	//01000001000100000000000000000000 - 补码 1,091,567,616
	printf("num的值为：%d\n", n);//1,091,567,616	  //以浮点型方式存储，以整型方式输出，值需要按照整型方式读取
	printf("*pFloat的值为：%f\n", *pFloat);//9.000000   //以浮点型方式存储，以浮点型方式输出，值不变


	return 0;
}

解题思路：

int n = 9;

最开始以整型保存

printf("n的值为：%d\n", n);

以整型方式存储，以整型方式输出，值不变，还是9

float* pFloat = (float*)&n;

以整型方式存储，以浮点型方式输出，值需要按照浮点型方式读取

0 00000000 00000000000000000001001

S=0

E=1-127= -126

M=00000000000000000001001

printf("*pFloat的值为：%f\n", *pFloat);//0.000000

最后计算得到0，因为以浮点型打印所以为0.000000

*pFloat = 9.0;

以浮点数的视角，存放浮点型的数字
   1001.0 - 二进制
   1.001 * 2^3
   (-1)^0 * 1.001 * 2^3
   S=0
   E=3+127=130 （二进制的E 10000010）
   M=1.001
   0 10000010 00100000000000000000000 - 浮点数存储形式

9.0   ->   1001.0   ->   ( - 1 ) ^0*1 . 001*2 ^3   ->   s = 0 , M = 1.001 , E = 3 + 127 = 130

整型读取会看作
   //01000001000100000000000000000000 - 补码（符号位为0 ，正数原反补一致，）换算为十进制打印输出：1,091,567,616
   printf("num的值为：%d\n", n);//1,091,567,616   //以浮点型方式存储，以整型方式输出，值需要按照整型方式读取
   printf("*pFloat的值为：%f\n", *pFloat);//9.000000 //以浮点型方式存储，以浮点型方式输出，值不变