浮点数的存储规则

CHAO 10-12

已于 2024-07-02 20:44:42 修改

阅读量1.1k

点赞数 19

分类专栏： C语言文章标签：前端算法 c语言开发语言

于 2024-07-02 20:38:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73736626/article/details/140133063

版权

C语言专栏收录该内容

16 篇文章 0 订阅

订阅专栏

首先先来看这样的代码

int main()
{
     int n = 9;
     float *pFloat = (float *)&n;
     printf("n的值为：%d\n",n);
     printf("*pFloat的值为：%f\n",*pFloat);
     *pFloat = 9.0;
     printf("num的值为：%d\n",n);
     printf("*pFloat的值为：%f\n",*pFloat);
     return 0;
}

那么输出的结果是：

为什么结果会是这样子呢，这就一定要搞懂涉及浮点型的存储规则了。

根据国际标准IEEE（电气和电子工程协会）754，任意一个二进制浮点数V可以表示成下面的形式：

(-1)^S * M * 2^E

(-1) ^S表示符号位，当S=0时，为正号，当S=1时，为负号。

M表示有效数字，大于等于1小于2。

2^E表示指数位。

就比如：

十进制的6.0可以写成二进制110.0，相当于1.1*2^2

按照这样的格式可以得出：S=0,M=1.1,E=2

十进制的-6.0可以写成二进制-110.0，相当于-1.1*2^2

按照这样的格式可以得出：S=1,M=1.1,E=2

IEEE 754 规定：

对于32位的浮点数，最高的第1位时符号位S，然后的8位是指数M，剩下的23位为有效数字位。

如图：

对于64位的浮点数，最高的1位是符号位S，接着的11位是指数E，剩下的52位为有效数字M。

IEEE 754也有一些特别的规定，就是M可以写为1.xxxxxxx的形式，所在计算机内部保存M时，默认这个数的第一位总是1，因此可以被舍去，只保存后面的xxxxxx部分。

例如保存1.001时只保存001等到读取的时候，再把第一位的1加上去。这样做的目的，是节省1位有效数字。

指数 E ，情况就比较复杂

E是一个无符号的整型（unsigned int）

E为8位，它的取值范围为0~255；如果E为11位，它的取值范围为0~2047。

但是，科学计数法中的E是可以出现负数的，所以IEEE 754规定，存入内存时E的真实值必须再加上一个中间数，对于8位的E，这个中间是127，对于11位的E，这个中间数是1023。

E从内存中取出还可以有三种情况

E不全为0或不全为1

这个时候浮点数就采取下面的规则，指数E加127(1023)，得到真实值，再将有效数字M前加上第一位的1。

例如：

0.5的二进制位0.1，但是正数部分必须为一，所以左移一次得到，(-1)^0*1*2^(-1),其阶码为-1+127=126，表示为 01111110，而尾数1.0去掉整数部分为0，补齐0到23位：00000000000000000000000

二进制表示方式为

0 01111110 00000000000000000000000

E 全为 0

这时，浮点数的指数E等于1-127（或者1-1023）即为真实值，有效数字M不再加上第一位的1，而是还原为0.xxxxxx的小数。这样做是为了表示±0，以及接近于0的很小的数字。

E 全为 1

这时，如果有效数字M全为0，表示±无穷大（正负取决于符号位s）

最后我们回到刚开始的问题，第一个输入的n在内存中存放的二进制为:

0000 0000 0000 0000 0000 0000 0000 1001

然后我们将它变成浮点数拆分得到符号位S=0，8位的指数 E=00000000，最后23位的有效数字M=000 0000 0000 0000 0000 1001。

9 ： 0000 0000 0000 0000 0000 0000 0000 1001

由于指数E全为0，所以符合上一节的第二种情况，所以最后是一个很接近0的整数。

然后是第二中，将9.0变成二进制为1001.0，即1.001 * 2^3

9.0: 1.001->(-1)^0*1.001 * 2^3 -> S = 0,E = 3+127 = 130,M = 1.001

那么，第一位符号位S=0，有效数字M是001后补足20个0，凑满23个，指数等于127+3 = 130便为1000 0001

写出二进制形式S+E+M便为

0 10000001 001 0000 0000 0000 0000 0000

这个32位的二进制数，还原成十进制，正是 1091567616 。

关注

19
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
浮点数的存储规则

EEE 754也有一些特别的规定，就是M可以写为1.xxxxxxx的形式，所在计算机内部保存M时，默认这个数的第一位总是1，因此可以被舍去，只保存后面的xxxxxx部分。例如保存1.001时只保存001等到读取的时候，再把第一位的1加上去。这样做的目的，是节省1位有效数字。
复制链接

扫一扫

专栏目录

CHAO 10-12 CSDN认证博客专家 CSDN认证企业博客

码龄2年

22: 原创

1万+: 周排名

6万+: 总排名

8528: 访问

: 等级

419: 积分

151: 粉丝

199: 获赞

0: 评论

123: 收藏

私信

关注

热门文章

分类专栏

C语言 16篇

最新评论

大端、小端存储
CSDN-Ada助手: 不知道算法技能树是否可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
C语言分支
CSDN-Ada助手: 恭喜你写了第三篇博客！标题为“C语言分支”，听起来很有趣呢。你在C语言领域的持续创作真是令人钦佩。从你的博客中，我可以感受到你对C语言分支的深入了解。接下来，我建议你可以考虑写一篇关于C语言循环结构的文章，因为循环也是C语言中非常重要的一部分。期待你的下一篇作品，加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
C语言实现扫雷游戏
CSDN-Ada助手: 很高兴看到你写了第二篇博客！继续创作是非常棒的，你的博客内容很实用。对于C语言实现扫雷游戏的主要函数，你已经很好地介绍了。我想补充一些与该博文相关的扩展知识和技能，这些可能对读者有所帮助。首先，你可以介绍如何使用数据结构来优化扫雷游戏的性能，例如使用二维数组来表示游戏板和雷区。其次，在游戏开发过程中，错误处理和异常处理是非常重要的技巧，你可以分享一些处理用户输入错误或者游戏逻辑错误的方法。最后，你可以探讨一些高级主题，如图形界面设计，例如使用图形库来为扫雷游戏增加更好的用户体验。继续加油，期待看到你的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。