（含笔试题）深度解析数据在内存中的存储

不穿格子衬衫

已于 2024-06-03 19:23:14 修改

阅读量1.2k

点赞数 58

分类专栏： c语言文章标签：开发语言存储整型浮点型原码反码补码

于 2024-06-01 11:15:34 首次发布

本文链接：https://blog.csdn.net/qq_58761784/article/details/139362478

版权

c语言专栏收录该内容

14 篇文章 0 订阅

订阅专栏

本章重点

1. 整形在内存中的存储：原码、反码、补码

2. 大小端字节序介绍及判断

2. 浮点型在内存中的存储解析

前言：

在c语言中，有像许许多多的数据类型，我们学过之后只需要使用就可以了，不关心它的内部是如何实现的，因此，有时我们写出的一些代码出现的结果是我们自己无法预料的，也许这样的问题正是由于我们不了解数据内部是如何存储和取出所导致的，今天，我们就来详细介绍数据在内存中是如何存储的，重点从整型与浮点型来展开介绍。

1.整型在内存中的存储

创建一个变量，系统会在内存中的栈区开辟一空间给这个变量，空间的大小由这个变量的类型决定，如果这个变量是整型，就为其分配四个字节的空间，如果是字符类型，就为其分配一个字节的空间......

那接下来我们谈谈数据所在开辟内存中到底是如何存储的。

比如：

int a=20;
int b=-20;

我们知道，变量a和b都是整型变量，各占四个字节，那它们是如果储存的呢？

那我们就要引入一几种新的概念了。

来了解以下概念：

1.1原码、反码、补码

计算机中的整数有三种2进制表示方法，即原码、反码和补码。

三种表示方法均有符号位和数值位两部分，符号位都是用0表示“正”，用1表示“负”，而数值位正数的原、反、补码都相同。

负整数的三种表示方法各不相同。

原码

一个十进制数的原码就是它的二进制数，如我们上面提到的a变量，它的十进制数值为20，那么将它转化为二进制就表示00010100，由于a是整型变量，占4个字节，也就是32位，所以它的原码为00000000 00000000 00000000 00010100。

反码

什么是反码呢？正数的原码，反码、补码均相同，所以我们不过多介绍，拿变量b举例，它是一个十进制值为-20的值，负数的反码是它的十进制数转化为二进制数，然后对它除最高位也就是符号位的其他每一位进行取反操作，这样就能得到它的反码，b的值为-20，那么它的二进制值就为

10000000 0000000 00000000 00010100，对它取反得到11111111 11111111 11111111 11101011，这就是它的反码。

补码

了解了负数的原码与反码之后，补码的理解也就变得非常容易了，负数的反码就是将它转化为二进制后，对它的二进制数取反之后再加一，-20的原码为10000000 0000000 00000000 00010100，反码为11111111 11111111 11111111 11101011，那么对它的反码加一，也就是对

11111111 11111111 11111111 11101011加一，我们就能得到11111111 11111111 11111111 11101100，这就是-20的补码。

画图演示：

我们再复习一下：正数的原码、反码、补码都是它的二进制数，负数的原码是它的有符号二进制数，反码是对它的原码除符号位之外其他每一位取反，补码则是对它的反码加1。

口诀：正数三码同，负变反加一。

事实上，对于整型来说，内存中存放的数据就是它的补码。

为什么呢？

在计算机系统中，数值一律用补码来表示和存储。原因在于，使用补码，可以将符号位和数值域统一处理；同时，加法和减法也可以统一处理（CPU只有加法器）此外，补码与原码相互转换，其运算过程是相同的，不需要额外的硬件电路。

我们来看看在内存中的存储：

我们给a赋值0x11223344，看看内存中是如何存储的：

可以看到，它在内存中是以44 33 22 11的形似存储的，我们发现顺序有点不对劲，这是又为什么？

2.大小端字节序介绍

什么是大小端字节序：

大端（存储）模式，是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址中；

小端（存储）模式，是指数据的低位保存在内存的低地址中，而数据的高位,，保存在内存的高地址中。

画图演示：

为什么会有大小端字节序：

为什么会有大小端模式之分呢？这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8 bit。但是在C语言中除了8 bit的char之外，还有16 bit的short 型，32 bit的long型（要看具体的编译器），另外，对于位数大于8位的处理器，例如16位或者32 位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

例如：一个 16bit 的 short 型 x ，在内存中的地址为 0x0010 ， x 的值为 0x1122 ，那么 0x11 为高字节， 0x22 为低字节。对于大端模式，就将 0x11 放在低地址中，即 0x0010 中， 0x22 放在高地址中，即 0x0011 中。小端模式，刚好相反。我们常用的 X86 结构是小端模式，而 KEIL C51 则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

了解了这些，我们来看一道某大厂的一道关于大小端字节序的笔试题：

请简述大端字节序和小端字节序的概念，设计一个小程序来判断当前机器的字节序。（10分）

怎么样，看完文章的前半部分第一问是不是很好回答呢，其实，第二问也不难，让我们设计一个程序来判断我们的编译器是大端字节序还是小端字节序，我们要知道，一个整型变量占四个字节，以整型变量a=1为例，如果当前编译器为小端字节序，它内部的存储就为0x01 00 00 00，如果为大端字节序，则它内部的存储就为ox 00 00 00 01，小端字节序的第一个字节为01，大端字节序的第一个字节为00，我们只要定义一个变量为1，然后访问它的第一个字节，如果结果为1，就是小端字节序，如果结果是0，则为大端字节序。

代码演示：

int main()
{
	int a = 1;
	if (*(char*)&a > 0)
	{
		printf("小端\n");
	}
	else
	{
		printf("大端\n");
	}
	return 0;
}

画图演示：

我们来看运行结果：

看来我们当前的编译器是小端字节序存储，至此，我们笔试题的第二问也完成了，怎么样，是不是没有那么难呢。

3.浮点数存储规则

了解了整型在内存中是如何存储的，我们接着来看浮点数的存储规则，相比整型的存储规则，浮点型数的存储规则更加巧妙，系统把每一个浮点数的正负，小数位分别划分了在内存中存储的位置，存储和取出都严格按照这个划分规则执行，所以我们如果要对一个数的内存进行操作，对待浮点数的操作不能像对待整数那样一个字节一个字节进行操作，如下面这个例子：

#include<stdio.h>
int main()
{
 int n = 9;
 float *pFloat = (float *)&n;
 printf("n的值为：%d\n",n);
 printf("*pFloat的值为：%f\n",*pFloat);
 *pFloat = 9.0;
 printf("num的值为：%d\n",n);
 printf("*pFloat的值为：%f\n",*pFloat);
 return 0;
}

来看结果：

num 和 *pFloat 在内存中明明是同一个数，为什么浮点数和整数的解读结果会差别这么大？

要理解这个结果，一定要搞懂浮点数在计算机内部的表示方法。

详细解读：

根据国际标准IEEE（电气和电子工程协会） 754，任意一个二进制浮点数V可以表示成下面的形式：

(-1)^S * M * 2^E (-1)^S表示符号位，当S=0，V为正数；

当S=1，V为负数。

M表示有效数字，大于等于1，小于2。

2^E表示指数位。

什么意思呢？

举例来说：十进制的5.0，写成二进制是 101.0 ，相当于 1.01×2^2 。

那么，按照上面V的格式，可以得出S=0，M=1.01，E=2。

十进制的-5.0，写成二进制是 -101.0 ，相当于 -1.01×2^2 。那么，S=1，M=1.01，E=2。

画图演示：

IEEE 754规定：

对于32位的浮点数，最高的1位是符号位S，接着的8位是指数E，剩下的23位为有效数字M。

对于64位的浮点数，最高的1位是符号位S，接着的11位是指数E，剩下的52位为有效数字M。

IEEE 754对有效数字M和指数E，还有一些特别规定。

前面说过， 1≤M，也就是说，M可以写成 1.xxxxxx 的形式，其中xxxxxx表示小数部分。

IEEE 754规定，在计算机内部保存M时，默认这个数的第一位总是1，因此可以被舍去，只保存后面的 xxxxxx部分。

比如保存1.01的时候，只保存01，等到读取的时候，再把第一位的1加上去。这样做的目的，是节省1位有效数字。

以32位浮点数为例，留给M只有23位，将第一位的1舍去以后，等于可以保存24位有效数字。

至于指数E，情况就比较复杂。

首先，E为一个无符号整数（unsigned int）

这意味着，如果E为8位，它的取值范围为0~255；如果E为11位，它的取值范围为0~2047。

但是，我们知道，科学计数法中的E是可以出现负数的，所以IEEE 754规定，存入内存时E的真实值必须再加上一个中间数，对于8位的E，这个中间数是127；对于11位的E，这个中间数是1023。

比如，2^10的E是10，所以保存成32位浮点数时，必须保存成10+127=137，即 10001001。

然后，指数E从内存中取出还可以再分成三种情况：

E不全为0或不全为1 （正常情况）

这时，浮点数就采用下面的规则表示，即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第一位的1。

比如： 0.5（1/2）的二进制形式为0.1，由于规定正数部分必须为1，即将小数点右移1位，则为 1.0*2^(-1)，其阶码为-1+127=126，表示为

01111110，而尾数1.0去掉整数部分为0，补齐0到23位00000000000000000000000，则其二进制表示形式为:

0 01111110 00000000000000000000000

E全为0

当E为全0时，这个数字要乘2^（1-127），一个无限接近于0的数字，这时，浮点数的指数E等于1-127（或者1-1023）即为真实值，有效数字M不再加上第一位的1，而是还原为0.xxxxxx的小数。

这样做是为了表示±0，以及接近于 0的很小的数字。

E全为1

这时，如果有效数字M全为0，表示±无穷大（正负取决于符号位s）；

到这里我们数据在内存中的存储内容到此结束啦，各位友友读到这里留下宝贵的三连和评论吧，有不足之处希望各位佬私信和我交流！！！

不穿格子衬衫

关注

58
点赞
踩
46

收藏

觉得还不错? 一键收藏
17
评论
（含笔试题）深度解析数据在内存中的存储

在c语言中，有像许许多多的数据类型，我们学过之后只需要使用就可以了，不关心它的内部是如何实现的，因此，有时我们写出的一些代码出现的结果是我们自己无法预料的，也许这样的问题正是由于我们不了解数据内部是如何存储和取出所导致的，今天，我们就来详细介绍数据在内存中是如何存储的，重点从整型与浮点型来展开介绍。大端（存储）模式，是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址中；小端（存储）模式，是指数据的低位保存在内存的低地址中，而数据的高位,，保存在内存的高地址中。
复制链接

扫一扫

专栏目录