C语言进阶之路--剖析数据在内存中的存储（详细版）

Yccsk♬

已于 2024-01-04 00:38:05 修改

阅读量1.1k

点赞数 21

文章标签： c语言开发语言

于 2024-01-04 00:13:23 首次发布

本文链接：https://blog.csdn.net/weixin_74149710/article/details/135361183

版权

好久不见啊大家！今天带来的内容是：数据在内存中的存储。

前言：

数据在内存中的存储大致可以分为三个部分，请看下图：

正文：

1、数据类型详细介绍

在初阶期间，我们对C语言的内置类型进行了简单的介绍，这些数据类型都是C语言规定好的，具有不可改动性，详情如下：

char      //字符型（1 byte）
short     //短整型（2 byte）
int       //整型（4 byte）
long      //长整型（4/8 byte）
long long //更长整型（8 byte）
float     //单精度浮点型（4 byte）
double    //双精度浮点型（8 byte）

由于每一种数据类型的大小不同，这就决定了它所存空间的数据范围的不同，如char和int所存储的数据范围不相同，那么具体能存储多少，又是以什么形式进行存储的呢？相信大家看完本篇内容，就会对此有了更加深入的认识。

我们了解到，在C语言中把类型分为以下几种：

下面对上述部分进行具体解释：

1）整型家族：

在这里，unsigned是表示无符号整型，signed表示有符号整型，所谓无符号整型就是这个数没有负数，只有正数和0，而有符号就表示这个数有正有负。我们平常书写的一些int，short，char，这些其实都是signed int、signed short、signed char,只不过signed都被省略了。

2）浮点型家族：

具体区别会在后面讲到。

3）构造类型：

构造类型，又称为自定义类型，主要包括：数组、结构体类型（struct）、枚举类型（enum）、联合体类型（union）

#include<stdio.h>
//结构体
struct book
{
	char name[20];
	int price;
};
//枚举enum即enumerate的缩写，意思就是列举
enum color{red=1,blue=2};
int main()
{
	//数组
	int arr[] = { 1,2,3,4,5 };
	struct book str = { "C语言程序设计",40 };
	printf("%s %d\n", str.name, str.price);
	printf("%d %d\n", blue, red);
	return 0;
}

注意：结构体成员访问时，结构体变量名.结构体成员、结构体变量地址（指针）->结构体成员。

4）指针类型：

在指针类型中，需要注意一点，就是void*，它可以接受任意类型的指针，就像一个垃圾桶一般，char*，int*，short*等都可以向里面扔东西，但是，正是因为void*什么都可以接受，所以它不能直接解引用，或者进行指针的运算，因为我们不能确定到底接受的是几个字节。

当然，若是想对void*类型进行解引用或者运算操作，必须先进行强制类型转换，才可以使用，详情代码如下：

#include<stdio.h>

int main()
{
   int a =10;
   void* p = &a;

  //强制类型转换为int*类型，再进行解引用操作

   *(int*)p = 50;

   printf("%d",a);
   return 0;
}

5）空类型

空类型经常用到函数的返回类型以及函数参数中

#include<stdio.h>
void test(void)//这里的返回类型以及参数都是void空类型
{
	printf("12345");
}
int main()
{
	test();
	return 0;
}

了解这些内容后，接下来开始讲解整型在内存中是如何存储的

2、整形数据在内存中的存储

我们知道，任何变量的创建都需要在内存中开辟一块空间，其空间的大小是由它们的类型决定，那么，这些数据是怎样在内存中存储的呢？我们现在就来探索一番。

首先，计算机中的整数有三种二进制表示方法，即原码、反码和补码。

三种表示方法均有符号位和数值位两部分，符号位是用0表示“正”，用1表示“负”，正数的原、反、补码都相同；负整数的三种表示方法各不相同。

1）原码

直接将相应的数字按照正负数的形式转换成二进制就可以得到原码。

2）反码

原码符号位保持不变，其余数值位取反得到反码。

3）补码

反码+1得到补码。

原码与补码有两种方式转换（见下图）

仅描述文字解释或许不好理解，下面来看如下图解：

运算图解如下：

对于整型来说，数据存放内存中存放的是补码。整型数据的二进制形式有三种，为什么要使用补码呢，为什么不直接使用原码？原因在于原码在计算中存在问题：

现在我们知道，整形数据是以补码的形式来存储和表示的，可以将符号位和数值位统一处理，同时，加法和减法也可以统一处理（CPU只有加法器）。此外，补码与原码之间的相互转换，其运算过程是相同的，使得计算机不需要额外的硬件电路。

补充：下面以char类型数据来详细说明如何求得相应的数据范围

3、大小端字节序的介绍及判断

刚刚我们了解到，整型在内存中存储的是补码，那么大家再来看，如果想要存储20和-10

#include<stdio.h>

int main()
{
   int a = 20;
   int b = -10;
  
   return 0;
}

通过调试我们发现，变量a和变量b在VS上存储的分别是 14 00 00 00 和f6 ff ff ff ，这是为什么呢？这里就涉及到了大小端字节序的存储，下面为大家娓娓道来：

大端（存储）模式：是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址中；

小端（存储）模式：是指数据的低位保存在内存的低地址中，而数据的高位，保存在内存的高地址中。

从上述概念中，我们不难发现VS的存储模式就是小端存储，因为它把低位的数据存储到内存的低地址，把高位存储在高地址。

注意：这里一定不能写成6f ff ff ff，因为f 6占一个字节。

下面设计使用代码来检验数据存储的方式是大端还是小端：

分析过程如下：

#include<stdio.h>

int check_sys()
{
   int i = 1;//00 00 00 01
   char* p = (char *)&i;//对i进行强制类型转换，只取它的首地址
   if(*p == 1)
      return 1;
   else
      return 0;
}
int main()
{
   int ret = check_sys();
   if(ret == 1)
   {
      printf("小端\n");
   }
   else
   {
      printf("大端\n");
   }
   return 0;
}

注意：char类型只占一个字节，因此不需要考虑存储顺序。

4、浮点型在内存中的存储

常见的浮点数

3.1415926

1E10

浮点数家族包括：float、double、long double类型

浮点数表示范围：float.h中定义

我们通过一个代码示例来了解浮点数数据的表示方法

int main()
{
   int n = 9;
   float *pFloat =(float *)&n;
   printf("n的值为：%d\n",n);
   printf("*pFloat的值为：%f\n",*pFloat);
   
   *pFloat = 9.0;
   printf("num的值为：%d\n",n);
   printf("*pFloat的值为：%f\n",*pFloat);
   return 0;
}

大家能答出相应的答案吗？你的答案是不是：9；9.0；9；9.0呢？下面来揭晓答案：

有没有发现第二个和第三个数的结果十分奇怪？根据这个代码的运行结果，我们可以大概猜出：浮点型数据的存储结构和整型数据的存储结构是不同的。那么怎样解释这种现象呢？接下来我们来了解浮点型数据在内存中的存储方式：

根据国际标准IEEE（电气和电子工程协会）754规定，任意一个二进制浮点数V可以表示成下面的形式：

V=（-1）^S*M*2^E（一定要牢记这个公式）

（-1）^S表示符号位，当S=0，V为正数；当S=1，V为负数。
M表示有效数字，1 ≤ M＜2。
2^E表示指数位。

将一个整型数据转化为对应的二进制浮点数的方法：

将整数位和小数位分开写，分别写出对应的二进制。

例如：

对于一个浮点型数据来说，其实很难表示后面的小数位，比如3.14这个数字，你很难找到合适的表示方法，小数位的表示是通过2的权重来表示的，小数点后一位对应的是2^(-1),第二位对应的是2^(-2)，依此类推。

介绍完浮点型数据的表示方法，接下来我们来看浮点型数据在内存中的存储。

经过上述学习，我们已经知道了整型数据在内存中存储是通过其对应二进制的补码存放的，但无论怎样，在计算机中存储数据只能存储其对应的二进制位，对于浮点型数据来说，在内存中的存储也是存储其对应的二进制序列，下面展开讲解:

S,E,M具体存储规则

S：只存一个数字：0->正数 1->负数
E：存储方式比较复杂，具体来说在内存中存储的E的值比真实值大127
M：对于一个有效数字来说，整数位一定是1，所以在存储的时候，为了能够更多的存储小数位，首位的1就不再存到内存之中，也就是M对应的内存空间存储的全是小数位。如果位数不够，在后面一直补0即可。在读取时，将所有的小数位读取之后，系统会自动补1。

举个例子：

注意：关于E的提取分为三种情况（第一种和第二种了解即可）

（1）E全为0，E真=-127，2^（-127）->0

这种情况下，M不再补1，V直接表示0.xxxxx*2^（-126），（可以理解为1向后退了一位）

（2）E全为1，E真=127，2^127 ->∞（根据符号位S判断）

（3）E其它情况，E真=E存-127

相信大家看到这里，对于数据在内存中的存储已经有了更加深入的了解，这些内容会帮助我们很好的修炼“内功”，望大家加油，不负自己！那么今天的分享就结束啦，喜欢的话可以点赞、评论加收藏哦！

Yccsk♬

关注

21
点赞
踩
21

收藏

觉得还不错? 一键收藏
3
评论
C语言进阶之路--剖析数据在内存中的存储（详细版）

char //字符型（1 byte）short //短整型（2 byte）int //整型（4 byte）long //长整型（4/8 byte）long long //更长整型（8 byte）float //单精度浮点型（4 byte）double //双精度浮点型（8 byte）由于每一种数据类型的大小不同，这就决定了它所存空间的数据范围的不同，如char和int所存储的数据范围不相同，那么具体能存储多少，又是以什么形式进行存储的呢？相信大家看完本篇内容，就会对此有了更加深入的认识。
复制链接

扫一扫