深度剖析数据在内存中的存储——C语言进阶

       

目录

一、数据类型介绍

1.1 整型家族

1.2 浮点型家族

1.3 构造类型

二、整型在内存中的存储

2.1 原码、反码、补码

2.2 大小端字节序

大小端存储的定义

 为什么会有大小端字节序之分呢?

怎么判断一个当前机器的大小端

2.3 有符号和无符号的区别

三、浮点型在内存中的存储

浮点数的存储规则


        今天在这里我们将探讨数据在内存中的存储,首先会带着大家了解一下数据类型,然后探讨一下整型在数据中是怎么储存的,原码、反码、补码是什么,然后了解一下大小端字节序,为什么按照这样的形式去存储,最后我们再探讨浮点数在内存中是如何存储的。下面来跟着小编一起探讨学习吧!

一、数据类型介绍

C语言为什么有这么类型呢?而且整型又分为整型、长整型、和短整型呢?其实是为了我们更好的去限定变量,比如用短整型来限制年龄。这样使用的话,内存利用率会高一些,我们在使用的时候,根据不同的取值范围来选定不同的类型。

1.1 整型家族

char:unsigned char、signed char

short:unsigned short 、signed short

int: unsigned int、signed int

long:unsigned long、signed long

        注意:字符归为整型家族的原因:字符本质上存储的时候,在内存中存储的是ASCII码值,是整型,所以归类的时候归类到整型。

1.2 浮点型家族

float

double

long double

1.3 构造类型

>数组类型

>结构体类型

>枚举类型

>联合(共用体)类型

注意:我们前面说介绍的几种类型都是C语言自己的内置类型,本身就存在的,我们可以直接用的,当然C语言也允许我们去构造类型,也就是自定义类型。

1.4指针类型

int* pi
char* pc
folat* pf
void* pv
结构体指针

注意:void表示空类型(无类型),通常用于返回类型,函数的参数,指针类型。

二、整型在内存中的存储

        一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。
那接下来我们探讨数据在所开辟内存中到底是如何存储的呢?

2.1 原码、反码、补码

        在了解整型在内存中的存储形式之前,我们先要了解学习一下三种形式,也就是整型数据的二级制表现形式:原码、反码、补码。
        这三种表示方法均由 符号位数值位两部分,最高位是符号位,符号位都是用‘0’表示正,用‘1’表示负。而数值位整数的原码反码补码都相同。
        负整数的三种表示方法各不相同
原码: 直接将数值按照正负数的形式翻译成二进制就可以得到原码。
反码: 将原码的符号位不变,其他位以此按位取反就可以得到反码。
补码: 反码+1得到的就是补码。
对于整型来说:数据存放在内存中,其实存放的是补码。这是为什么呢?
①使用补码,可以将符号位和数值位统一处理
②加法和减法也可以统一处理,(CPU只有加法器),此外,补码与原码相互转换,其运算过程是相同的,不需要额外硬件电路。

 

 

 验证我们创建的num变量在VS这个编译器上是如何存放的,在VS这个编译器上,为了方便展示,显示的是十六进制,如上图,因为我们这里设置的是32位,也就是32个比特位,32个二进制的数转换成十六进制,四个二进制位换成一个16进制位,也就转换成8位16进制的数,num的补码换成16进制的数就为0x 00 00 00 0a,num2的补码换成16进制的数就为

0x ff ff ff f6。但是存进去之后我们发现是倒着存储的,这是为什么呢?这就涉及到大小端的问题,接下来,我们来学习一下大小端字节序。

2.2 大小端字节序

大小端存储的定义

        正如刚刚说说,当我们知道,计算机存储一个整型数据,是将这个整形数据的补码存放在内存中的,但是我们发现,存储的时候是倒着存储的,这是为什么呢?这是就要学习一个概念,大端和小端

大端(存储)模式:数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;

小端(存储)模式:数据的低位保存在内存的低地址中,而数据的高位,保存在内存的高地址中;

 为什么会有大小端字节序之分呢?

        为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8 bit。但是在C语言中除了8 bitchar之外,还有16 bitshort 型,32 bitlong型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32 位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因 此就导致了大端存储模式和小端存储模式。

例如:一个 16bit 的 short x ,在内存中的地址为 0x0010 x 的值为 0x1122 ,那么 0x11 为 高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高 地址中,即 0x0011 中。小端模式,刚好相反。我们常用的 X86 结构是小端模式,而 KEIL C51 则 为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式 还是小端模式。

怎么判断一个当前机器的大小端

        其实我们可以通过调试的方法直接去看的。如下图

 当然我们可以写个代码(程序)去测试当前机器是大端还是小端

        假设有个int变量a,大小为1,写成16进制就是0x 00 00 00 01,那么存到内存中也就两种情况,如下图所示,仔细对比一下我们会发现,我们只要对比第一个字节的内容,是不是就能区别出来了,如果第一个字节内容是‘1’就是小端,如果第一个字节内容是‘0’就是大端。

         那么问题来了,如何拿到第一个字节的内容呢,其实也很简单,我们取地址a拿到的就是a的地址,a占四个字节,每一个字节都有地址,取地址a其实拿到的是a第一个字节的地址,类型是int*,如果对int*类型数据解引用拿到的是四个字节,但是当我们把int*的数据强制类型转换成char*类型的数据后,再解引用,拿到(访问)的就是一个字节的地址,这时候再进行判断,也就实现我们的目的了。具体代码如下

int main()
{
	int a = 1;
	int* pa = &a;//取出a的地址-int*类型
	char* p = (char*)pa;//强制类型转换成char*类型
	if (*p == 1)//在解引用进行判断
		printf("小端");
	else
		printf("大端");
	return 0;
}

2.3 有符号和无符号的区别

对整型家族来说,有有符号和无符号的区别,拿int 来举例,分为unsigned int(无符号)和signed int(有符号)。

注意:①我们平时直接写的int  short 以及long其实都是有符号的,只是把signed给省略了,但是如果要写无符号,不能省略unsigned

           ② char比较特殊,我们平时写的char到底是signed char还是unsigned char不确定,C语言标准没有给出明确规定,这时就取决于编译器的实现,通常我们见到的编译器下(如VS)一般来说,char指的都是signed char。

那么具体的区别是什么呢?

就拿char举例,char是一个字节,也就是八byte,当是signed char的时候,是有符号数,存在符号位的,也就把最高位当作符号位,符号位为‘0’时,就是正数,符号位为‘1’时就是负数。当是unsigned char的时候,是无符号数,也就没有符号位,把八个byte全部当作数值位来看待。同理int short long都是一样的。

讲到这里,有些同学会有一些疑问,一个有符号char的表示范围是多少呢?一个无符号char的表示范围又是多少呢?

  如上图所示,当我们把八个比特位的所有情况全部写出来后,我们就可以以此计算。

注意:①最高位是符号位 ②10000000表示的是-128

 同理可以算出unsigned char的表示范围。由此可见signed  char的表示范围位-128——127,signed char 表示的范围为0——255。

三、浮点型在内存中的存储

常见的浮点数:3.14159

                         1E10(1.0×10^10)

浮点数家族包括:float  double  long double

浮点数也是有限制范围的,在float.h这个头文件中

我们先来看一串代码的运行结果吧

由上图我们可以得出浮点数在内存的存储以及取出的形式与整型是不同的,是有差异的。那具体是怎么存储的呢?

浮点数的存储规则

根据国际标准 IEEE (电气和电子工程协会) 754 ,任意一个二进制浮点数 V 可以表示成下面的形式:
(-1)^S * M * 2^E
(-1)^S表示符号位,当 S=0 V 为正数;当 S=1 V 为负数。
M表示有效数字,大于等于1 ,小于 2
2^E表示指数位。
举例来说:
十进制的 5.0 ,写成二进制是 101.0 ,相当于 1.01×2^2
那么,按照上面 V 的格式,可以得出 S=0 M=1.01 E=2
十进制的  -5.0 ,写成二进制是 - 101.0 ,相当于 - 1.01×2^2 。那么, S=1 M=1.01 E=2
IEEE 754 规定:
对于 32 位的浮点数,最高的 1 位是符号位 S ,接着的 8 位是指数 E ,剩下的 23 位为有效数字 M

 

对于 64 位的浮点数,最高的 1 位是符号位S,接着的 11 位是指数 E ,剩下的 52 位为有效数字 M
IEEE 754 对有效数字 M 和指数 E ,还有一些特别规定。
前面说过, 1≤M<2 ,也就是说, M 可以写成 1.xxxxxx 的形式,其中 xxxxxx 表示小数部分。
IEEE 754 规定,在计算机内部保存 M 时,默认这个数的第一位总是 1 ,因此可以被舍去,只保存后面的 xxxxxx部分。
比如保存 1.01 的时候,只保存01 ,等到读取的时候,再把第一位的 1 加上去。这样做的目的,是节省 1 位有效数字。以 32 位浮点数为例,留给M 只有 23 位将第一位的1 舍去以后,等于可以保存 24 位有效数字。

 

至于指数 E ,情况就比较复杂。
首先, E 为一个无符号整数( unsigned int
        这意味着,如果E 8 位,它的取值范围为 0~255 ;如果 E 11 位,它的取值范围为 0~2047 。但是,我们 知道,科学计数法中的E 是可以出 现负数的,所以IEEE 754 规定,存入内存时 E 的真实值必须再加上一个中间数,对于 8 位的 E ,这个中间数 是127 ;对于 11 位的 E ,这个中间 数是1023 。比如, 2^10 E 10 ,所以保存成 32 位浮点数时,必须保存成 10+127=137 ,即10001001。
然后,指数 E 从内存中取出还可以再分成三种情况:
E不全为0或不全为1
这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。
比如:
0.5(1/2)的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为
1.0*2^(-1),其阶码为-1+127=126,表示为 01111110,而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,
则其二进 制表示形式为: 0 01111110 00000000000000000000000
E全为0
这时,浮点数的指数 E 等于 1-127 (或者 1-1023 )即为真实值,
有效数字 M 不再加上第一位的 1 ,而是还原为 0.xxxxxx 的小数。这样做是为了表示 ±0 ,以及接近于0的很小的数字。
E全为1
这时,如果有效数字 M 全为 0 ,表示 ± 无穷大(正负取决于符号位 s );
好了,关于浮点数的表示规则,就说到这里就结束了 这时再去看看上面的题目的时候就迎刃而解了。
        希望今天这篇文章对你起到一定的帮助。如果觉得小编写的还可以的,可以一键三连(点赞,关注,收藏)哦,你们的支持是对小编极大的鼓励。谢谢。

 

  • 16
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 15
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

褪色~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值