深度剖析数据在内存中的存储（超详细版）

最新推荐文章于 2024-07-19 13:54:07 发布

Mylvzi

最新推荐文章于 2024-07-19 13:54:07 发布

阅读量1k

点赞数 61

分类专栏： C语言学习文章标签： c语言数据在内存中的存储

本文链接：https://blog.csdn.net/Mylvzi/article/details/130906599

版权

C语言学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文详细介绍了数据在内存中的存储方式，包括数据类型、整型数据的原码、反码、补码表示，以及大端和小端字节序的概念。文章还探讨了浮点型数据的存储规则，遵循IEEE754标准，并通过实例解析了不同类型数据在内存中的表示差异。

摘要由CSDN通过智能技术生成

💕"痛苦难以避免，而磨难可以选择。"-->村上春树💕

作者：Mylvzi

文章主要内容：数据在内存中的存储

前言：数据在计算机中的存储

正文：

1.详解数据类型

2.整型数据在内存中的存储：原码，反码，补码

3.大端，小端的介绍以及字节序

4.浮点型数据在内存中的存储

前言：数据在计算机中的存储

数据在计算机中的存储位置不同，但大致可以分为以下几个空间

读者只需了解数据在计算机中的存储有这五种位置即可，我们今天详细讲解的是数据在内存中的存储，而数据在内存中的存储又大致可以分为三个部分，请看图：

正文：

1.详解数据类型

我们已经学过C语言中基本的内置数据类型，这些数据类型都是C语言规定好的，具有不可改动性。如：

注意：C语言规定sizeof(long)>=sizeof(int)

除了C语言规定的基本内置数据类型外，还有其他许多数据类型，下面对这些数据类型进行归类：

浅浅解释一下void*数据类型：

int main()
{
/*  void*叫做通用指针类型，可以存储任意数据类型的地址，无需进行强制类型转换*/
	int a = 10;
	void* vp = &a;//void*可以存储任意数据类型的地址
	int* ip = (int*)vp;//使用int*类型的指针变量来获取void*指针所指向数据的内存空间
	printf("%d\n", *ip);//打印10
	return 0;
}

补充：在整型数据中我们不仅要了解其分类，还要了解每个数据类型对应的数据范围（可在头文件<limits.h>中查看），下面以char类型数据来详细讲解下如何求得相应的数据范围

2.整型数据在内存中的存储：原码，反码，补码

我们知道变量的存储是要在内存中开辟空间的，开辟空间的大小取决于相应的数据类型，例如：

char b =a; 创建变量b,数据类型是char,所以向内存申请1个字节的空间

int a =-20; 创建变量a,数据类型是int,所以向内存申请4个字节的空间

double c =3.14; 创建变量c,数据类型是double,所以向内存申请8个字节的空间

我们还知道，数据在内存中的存储是以二进制的形式进行存储，那么对于我们最熟悉的整形数据来说，他在内存中是如何存储的呢？要了解整形数据的存储，需要知道整型数据的三个二进制形式：原码，反码，补码；（以下内容均是在32位机器下）

基本概念

三种表示方法都有符号位（二进制序列首元素）和数值位，规定0为正，1为负，对于正数来说其原码，反码，补码均相同，而负数的原码，反码，补码需要通过一定变形获得

原码：一个数对应的二进制序列如:-15->10000000000000000000000000001111

反码：原码除符号位外其他位按位取反如:-15的反码:11111111111111111111111111110000

补码：反码+1=补码如:-15的补码：11111111111111111111111111110001

通过代码验证-15的补码：关于更多有关二进制序列的代码请看：https://mp.csdn.net/mp_blog/creation/editor/130634692

通过上述代码我们可以发现，-15在内存中的存储是通过其补码存储的，整型数据的二进制形式有三种，为什么要使用补码呢，为什么不能直接使用原码？原因在于原码在计算过程中存在缺陷：

现在我们知道，整型数据是以补码的形式来存储和表示的，使用补码可以将符号位和数值域统一处理；同时，又因为cpu只能处理加法，补码和原码互相转换，使的计算机不需要额外的硬件电路。（不得不感概科学家的智慧，能想出补码这种形式来解决问题，respect!）

补码与反码的转换：（补码到原码有两种方式见图）

3.大端，小端的介绍以及字节序

一个奇怪的现象：


int main()
{
	int a = 0x11223344;//创建一个整型变量a
	printf("%d", a);
	return 0;
}

观察a的内存：（补充一下：将a设置为16进制数是因为数据在内存中存储是二进制，但是是以16进制表示的，将a设置为16进制数便于我们观察他在内存中存储的情况）

我们发现，a在内存中存储的时候好像是“倒过来”存储的，那为什么会这样呢？其实这是一种小端的字节序存储，是数据存储方式的一种，下面详细介绍大端字节序存储和小端字节序存储：

实际上，之所以有大小端之分就是因为在数据存储时我们要考虑多字节数据存储的一个顺序（所以，对于只有一个字节的char型变量来说，不存在存储顺序的问题）

我们常用的 X86 结构是小端模式，而 KEIL C51 则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

下面设计代码来检验数据存储的方式是小端还是大端：

分析过程：

代码如下：

//设计代码验证数据的存储方式
int check_sys()
{
	int a = 1;//00 00 00 01
	char* p = (char*)&a;//对a进行强制类型转换，只取他的首地址
	if (*p == 1)
		return 1;
	else
		return 0;
}
int main()
{
	int ret =check_sys();
	if (ret == 1)
		printf("小端\n");
	else
		printf("大端\n");
	return 0;
}

几个经典代码练习帮助理解：

练习1：


//输出什么？
#include <stdio.h>
int main()
{
    char a= -1;
    signed char b=-1;
    unsigned char c=-1;
    printf("a=%d,b=%d,c=%d",a,b,c);
    return 0;
}
//a=-1,b=-1,c=255

下面详细讲解一下：

练习2：

int main()
{
    char a = -128;
    //先想-128是否属于char类型的数据范围之内（-128~127）属于
    //直接写出二进制序列：10000000
    //整形提升:111111111111111111111111100000000
    //%u:是以无符号整型输出，数据范围是恒>=0的，所以其原码=反码=补码
    //输出结果：4294967168
    printf("%u\n", a);
    return 0;
}

练习3：

int main()
{
    char a = 128;
    //128不属于char类型的数据范围之内-128~127
    //先写补码，再利用截断
    //00000000000000000000000010000000（2^7=128）
    //01111111111111111111111101111111
    //01111111111111111111111110000000
    //截断：10000000(和练习2中a存储的数据相同，故答案相同)
    //输出结果：4294967168
    printf("%u\n", a);
    return 0;
}

练习4：

int main()
{
	int i = -20;
	 //10000000000000000000000000010100
	 //11111111111111111111111111101011
	 //11111111111111111111111111101100->-20的补码
	unsigned  int  j = 10;
	 //00000000000000000000000000001010->原反补相同
//相加:11111111111111111111111111110110
	//:11111111111111111111111111110101
	//:10000000000000000000000000001010->-10
	//输出结果：-10
	printf("%d\n", i + j);

	return 0;
}

练习5：

int main()
{
	unsigned int i;
	for (i = 9; i >= 0; i--)
	{
		printf("%u\n", i);
	}
	//i=0之后进行i--的操作，i=-1
	//但是i是unsigned int的类型，并不包括负数，所以要先写补码，再截断（这道题不用截断）
	//10000000000000000000000000000001
	//11111111111111111111111111111110
	//11111111111111111111111111111111->i中存储的数据（注意首位并不是符号位，而是数值位）
	//最后会发生死循环
	return 0;
}

练习6：

int main()
{
    char a[1000];
    int i;
    for (i = 0; i < 1000; i++)
    {
        a[i] = -1 - i;
    }
    printf("%d", strlen(a));
    //输出：255
    return 0;
}

练习7：

unsigned char i = 0;
int main()
{
    for (i = 0; i <= 255; i++)
    {
        printf("hello world\n");
    }
    //先想unsigned char数据类型的数据范围：0~255
    //而我的i<=255,所以此代码会循环打印hello world
    return 0;
}

读者可以重点看练习1中的总结，了解基本的做题规则与想法，那才是精华！

4.浮点型数据在内存中的存储

基本概念：

常见的浮点数及表示方法

3.14,2.718.......

1e2 ->1*10^2 e是指数exponent(指数)的缩写，常被用作科学记数法中的指数

1E3 ->1*10^3

浮点型家族：float,double,long double

注意：如果没有强制定义，写出一个小数会默认为double类型，如果需要的话可以加上后缀f

先看代码：

/*浮点型数据存储的一个引例*/
int main()
{
	int n = 9;
	float* pFloat = (float*)&n;
	printf("n的值为：%d\n", n);
	printf("*pFloat的值为：%f\n", *pFloat);
	*pFloat = 9.0;
	printf("num的值为：%d\n", n);
	printf("*pFloat的值为：%f\n", *pFloat);
	return 0;
}

读者能答出所有答案吗？你的答案是： 9；9.0；9；9.0吗？下面请看答案：

有没有发现第二个和第三个数的结果十分奇怪？由这个现象我们不难猜出：“整型数据的存储和浮点型数据的存储应该是不同的”，那该如何解释这个现象，我们首先要了解浮点型数据在内存中的存储方式：

根据国际标准IEEE（电气和电子工程协会） 754，任意一个二进制浮点数V可以表示成下面的形式：

V = (-1)^S * M * 2^E（一定要牢记这个公式，后面的存储也会用到）

S 符号位，用于表示浮点数的正负 S=0,V>0; S=1,V<0;
M 有效数字 1<M<2
E exponent 指数

将一个整型数据转化为对应的二进制浮点数的方法：将整数位和小数位分开写，分别写出对应的二进制。

例如：

对于一个浮点型数据来说，其实很难表示后面的小数位，比如3.14这个数字，你很难找到合适的表示方法，小数位的表示是通过2的权重来表示的，比如小数点后一位对应的是2^(-1),第二位对应的是2^(-2),以此类推。

浮点型数据在内存中的存储

介绍完浮点型数据的表示方法，接下来介绍浮点型数据在内存中的存储。

我们知道，整型数据在内存中的存储是通过其对应二进制的补码存放的，但无论怎样，在计算机中存储数据只能存储其对应的二进制位，对于浮点型数据来说，在内存中的存储也是存储其对应的二进制序列，下面请看：

V = (-1)^S * M * 2^E

可见，一个二进制浮点数是通过S,E,M的组合形成的，所以，二进制浮点数在内存中的存储也是通过存储S,E,M来存储对应的二进制序列

S,E,M具体存储规则

S:只存一个数字：0->正数 1->负数
E:存储方式比较复杂，具体来说在内存中存储的E的值比真实值大127
M:对于一个有效数字来说，整数位一定为1，所以在存储的时候，为了能够更多的存储小数位，首位的1就不在存到内存之中，也就是M对应的内存空间存储的全是小数位！如果位数不够，在后面一直补零即可。在读取时，将所有的小数位读取之后，系统会自动补1