C语言中的浮点数存储

本文详细解释了C语言中浮点型数据的存储机制,包括为何不能执行位运算,以及浮点型转整形时编译器的处理过程。通过IEEE754标准,探讨了浮点数的表示方式和转换规则,特别关注了E值的调整和浮点数表示的特殊情况。
摘要由CSDN通过智能技术生成

首先明确一个概念:C语言中整形是按照二进制存储在内存中,浮点型是按科学计数法存储在内存中(本质上存储的还是二进制数据0和1)。

如果没看懂这句话,没关系!看完以下正文,你就会豁然开朗!并且预先提出两个问题:

1)为什么浮点型不能执行位运算?

2)浮点型数据转换为整形数据时,编译器内部做了什么样的处理?

接下来,讲解C语言中浮点型数存储的规则:

c语言中的浮点型有如下几种 (float ,double ,longdouble),因为不同系统平台下数据类型的长度会不一样,这里我们统一在32位GCC编译器下, float=4Byte,double=8个Byte

先定义

float num_1=10.5f;  /* 这里有个小知识点,很多编译器中,如果10.5后面不加f(小写),会默认为存储为double类型*/
double num_2 = 11.5 

根据国际电器和电子工程协会,标准IEEE754规定,浮点数可以按照以下规则存储

(-1)^S*M*2^E

可以将上述公式分为两部分来看(-1)^S是确定数字是整数还是负数。M*2^E确定的数字绝对值的大小。

这里的M必须是二进制数。

S必须是整数1,或整数0

E也必须是>=0的整数

结合图形来看:

C语言存储浮点型数据float时,会将内存分为三个区域。结合实例我们来看

float num_1=10.5,先转换为IEEE754格式,首先该数为正数故s=0;(-1)^0=0,符号位=0,表示正数。

第1步:在把10.5转换为科学计数法 1.05*10^1,

第2步:再把10.5二进制格式,其中M要为二进制数据,dec(10.5)=bin(1010.1)

第3步:二进制写成科学计数法10.5=1010.1*2^0 = 1.0101*2^3。

10.5为正数于是 31符号位=0、E=3 =0000 0011 。有效数字M=1.0101。但是如果你按上述来写,肯定是错误的。浮点数存储时,还要遵守一定的转换方式:转换规则如下(也是很重要的一个知识点)

(规则1)1<=M<2。IEEE 754规定 M只存储小数部分,于是10.5只会存储0101,系统会默认最高位为1(。

(规则2)而E,存储时:

float类型数据,存储值=E+127.

double类型数据,存储值=E+1023.

首先得明确是一个无符号数,10.5=1.0101*2^3,E=3,二进制表示为 0000 0011。IEEE754规定了。对于8bit长度的float类型。e需要加上127,在此得到的数,再存储到内存中去。3+127=129=1000 0010。double类型,应该加上1023。至于为什么,后面细说。

于是10.5的正确格式应该是上图所示的格式。

至于E为什么要+127(float)+1023(double)。

问:0.5该如何存储?

转换为二进制科学计数法1*2^-1。如果我们E不做处理。

将会有如下问题,s=0,没有问题,E=-1,E是无符号数,不能显示为-1。M存储的是小数部分,全部存储为0。

故为了解决E无法表示负数的问题,才引入了E+127(Float),和E+1023(double)。为了描述方便,下面统一以float类型为例,当E存储值<127时,认定E为负数,如E存储值为125,则E的实际值为-2。当E的存储值>127时,E的真实值为正数,130=3。以此类推。。。。

故,本质上E存储时需要+127或+1023是为了解决浮点数,(-1,1)注意是不包含边界数的关系,的存储问题。

E不全为0或不全为1

这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将 有效数字M前加上第一位的1。

比如:

0.5(1/2)的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为 1.0*2^(-1),其E为-1+127=126,表示为:

01111110,而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,则其二进 制表示形式为:

0 01111110 00000000000000000000000

E全为0

这时,浮点数的指数E等于1-127(或者1-1023)即为真实值, 有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于 0的很小的数字。

E全为1

这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s);

回答一开始提出的两个问题

1)为什么浮点数不能执行位运算;

答:整形执行位运算,准确的来说是无符号整形,才能执行位运算

移位运算:<<和>>

左移,一位相当于数字*2(加倍)

右移,相当于数字/2

根据浮点数的结构来看,浮点数,明显是达不到这样的效果的。

大家拿起笔,思考一下,浮点数执行,按位与&,按位或|,按位异或等运算时,是何种情况。

2)浮点型数据转换为整形数据时,编译器内部做了什么样的处理?

答:

#include <stdio.h>
#include <stdlib.h>

int main()
{   int a=1090;
    float b=1020.23;
    a=b;
    printf("a的值为%d:",a);

  
    return 0;
}

看输出结果:


看起来是似乎很合理?浮点数直接去掉小数部分,直接将自己的整数部分,赋值给了整形数据.其实编译器是先将浮点数值算出来,再截取整数部分截取给整形数据。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值