float与double类型的内存分布，精度和范围

最新推荐文章于 2023-08-01 15:22:56 发布

helmsgao

最新推荐文章于 2023-08-01 15:22:56 发布

阅读量1.2k

点赞数

分类专栏： C++语言文章标签： float 存储

C++语言专栏收录该内容

69 篇文章 3 订阅

订阅专栏

float与double类型的内存分布，精度和范围

内存分布：

C/c++的浮点数据类型有float和double两种。

float大小为4字节，内存中的存储方式如下：

符号位(1bit)指数(8bit)尾数(23bit)

double大小为8字节，内存中的存储方式如下：

符号位(1bit)指数(11bit)尾数(52bit)

符号位决定浮点数的正负，0正1负。指数和尾数均从浮点数的二进制科学计数形式中获取。

如，十进制浮点数2.5的二进制形式为10.1，转换为科学计数法形式为(1.01)*(10^1)。

由此可知指数为1，尾数（即科学计数法的小数部分）为01。

根据浮点数的存储标准，指数用移码表示。0的float类型移码为127（0111 1111），0的double类型移码为1023(011 1111 1111)。运算时，在0 的移码基础上加指数，得到的就是内存中指数的表示形式。尾数则直接填入，如果空间多余则以0补齐，如果空间不够则0舍1入。

所以float和 double类型分别表示的2.5如下（二进制）：

符号位指数尾数

0 1000 0000 010 0000 0000 0000 0000 0000

0 100 0000 0000 0100 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

精度：

float和double的精度是由尾数的位数来决定的。

float：2^23 = 8388608，一共七位，这意味着最多能有7位有效数字，但绝对能保证的为6位，也即float的精度为6~7位有效数字； double：2^52 = 4503599627370496，一共16位，同理，double的精度为15~16位。

范围:

float类的指数是8位移码,最大为127最小为-127,127用来作2的指数,为2^127,约等于 1.7014*10^38, 而我们知道,floa示数范围约为- 3.4*10^38-------3.4*10^38, 这是因为尾数都为1时,即1.11..11约为2,因此浮点数的范围就出来了.double的情况与float完全相似.

附：

　移码（又叫增码）是符号位取反的补码，一般用做浮点数的阶码，引入的目的是为了保证浮点数的机器零为全0。

　　①移码的定义：设由1位符号位和n位数值位组成的阶码，则 [X]移=2En + X -2n≤X ≤ 2n

　　例如： X=+1011 [X]移=11011 符号位“1”表示正号

　　X=－1011 [X]移=00101 符号位“0”表示负号

　　②移码与补码的关系： [X]移与[X]补的关系是符号位互为相反数（仅符号位不同），

　　例如： X=+1011 [X]补=01011 [X]移=11011

　　X=－1011 [X]补=10101 [X]移=00101

　　③移码运算应注意的问题：

　　◎对移码运算的结果需要加以修正，修正量为2En ，即对结果的符号位取反后才是移码形式的正确结果。

　　◎移码表示中，0有唯一的编码——1000…00，当出现000…00时（表示－2En），属于浮点数下溢。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。