深度剖析数据在内存中的存储（c语言进阶）

最新推荐文章于 2023-10-06 12:00:00 发布

lucas_dd

最新推荐文章于 2023-10-06 12:00:00 发布

阅读量173

点赞数 2

分类专栏： c语言进阶

本文链接：https://blog.csdn.net/qq_52906742/article/details/119011201

版权

c语言进阶专栏收录该内容

2 篇文章 0 订阅

订阅专栏

文章目录

在这里插入图片描述

数据类型的详细介绍

整型家族

signed表示有符号类型，unsigned表示无符号类型

char

signed char
unsigned char

short

signed short
unsigned short

int

signed int
unsigned int

long

signed long
unsigned long

浮点型家族

float

double

构造类型

数组类型
结构体类型 struct
枚举类型 enum
联合体类型 onion

指针类型

int *
float *
char *
void *

空类型

void表示空类型

通常应用于函数的返回类型、函数的参数、指针类型

整型在内存中的存储（重点）

对于整型在内存中的存储，我们需要先了解原码，反码，补码的概念，这是理解整型在内存中存储的基础

原码

整型数据所对应的二进制序列

反码

符号位（所对应二进制序列的最高位，0表示正数，1表示负数）不变，其他位按位取反

补码

反码+1得到补码

正数的原码、反码、补码相同。对于数据来说，是以补码的形式存储在内存中的。

为什么要用补码来存储呢？

在计算机系统中，数值一律用补码来表示和存储。原因在于使用补码，可以将符号位和数值域统一处理，同时，加法和减法也可以统一处理（CPU只有加法器）此外，补码与原码相互转换，其运算过程是相同的，不需要额外的硬件电路。

补码和原码相互转换运算过程相同，意思是原码–>补码符号位不变，其他位按位取反加1，补码–>原码符号位不变，其他位按位取反加1。

例如：

int a = -10 ； int在vs 2019中占四个字节，一个字节为8个bit位，故二进制序列为32位。最高位表示符号位。

原码：10000000000000000000000000001010 补码符号位不变，其他位按位取反有：10000000000000000000000000001001

反码：11111111111111111111111111110101 取反后加一得到：10000000000000000000000000001010 （原码）

补码：11111111111111111111111111110110

大小端字节序介绍及判断

大端存储模式：是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址中。

小端存储模式：是指数据的低位保存在内存的低地址中，而数据的高位,，保存在内存的高地址中。

例如：

int a = 0x11223344；11为高位，44为低位

假设内存是由低到高的，

11 22 33 44 这种存储模式就是大端存储。

低高

反过来

44 33 22 11 这种存储模式就是小端存储。

低高

在这里插入图片描述

在vs中查看变量a在内存中的存储可以看出为vs编译器的存储模式为小端存储。

但是为什么会有大小端之分呢？

这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8bit。但是在C语言中除了8bit的char之外，还有16bit的short型，32bit的long型（要看具体的编译器），另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。
例如一个16bit的short型x，在内存中的地址为0x0010，x的值为0x1122，那么0x11为高字节，0x22为低字节。对于大端模式，就将0x11放在低地址中，即0x0010中，0x22放在高地址中，即0x0011中。小端模式，刚好相反。我们常用的X86结构是小端模式，而KEIL C51则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

作者：starmier
链接：https://www.jianshu.com/p/0ebdf779cab5

那么该如何设计一段代码来判断当前机器的存储模式呢？

#include<stdio.h>

int main()
{
    int a = 1;
    //a的16进制序列为00 00 00 01对应着int的四个字节
    //如果只取第一个字节的地址解引用，如果得到的是0，则为大端存储，得到的是1则为小端存储
    char* x = (char*)&a;
    if (*x == 1)
    {
        printf("小端");
    }
    else if(*x == 0)
        printf("大端");
    return 0;
}

在这里插入图片描述

#include<stdio.h>

int check_sys()
{
 	union
	 {
 		int i;
 		char c;
 	}un;
	un.i = 1;
	return un.c;
}
//使用联合体来判断，因为int类型的i和char类型的变量c共用了第一个字节，
//## 标题所以如果只初始化i，则c就是i第一个字节所对应的数值，为1或者为0.
int main()
{
 	int ret = check_sys();
 	if(ret == 1)
 	{
	 	printf("小端\n");
 	}
 	else
 	{
 		printf("大端\n");
 	}
 	return 0;
}

整型存储练习

这些知识还是比较难懂的，所以有些练习是必要的，来帮助大家理解。题目理解了的话，不是很难。

1.
//输出什么？
#include <stdio.h>
int main()
{
    char a= -1;
    signed char b=-1;
    unsigned char c=-1;
    printf("a=%d,b=%d,c=%d",a,b,c);
    return 0;
}

分析：
整型a,b,c的原码为10000000000000000000000000000001，反码11111111111111111111111111111110，补码为11111111111111111111111111111111
char占一个字节，8个bit位
故补码为11111111
因为要整型打印，所以涉及到整型提升（补全符号位）
对于char和signed char，提升到整型后的补码序列为11111111111111111111111111111111
该补码所对应的原码为10000000000000000000000000000001
对于char和signed char有对应值为-1.
而对于unsigned char有，因为无符号类型全为正数，故整型提升前面补0.提升到整型后的补码序列为00000000000000000000000011111111
因为是无符号char，补码也即为原码，有对应值为255.
输出即为a = -1，b = -1，c = 255
补充：
1.对于char，是signed char，还是unsigned char，取决于编译器，c语言的标准没有规定。
小编所用的vs 2019是相当于signed char，大部分编译器是signed char
2.int就是相当于signed int，这是c语言标准规定的。

在这里插入图片描述

2.
//输出什么？
#include <stdio.h>
int main()
{
    char a = -128;
    printf("%u\n",a);
    return 0;
}

分析：
整型a的原码为1000000000000000000000010000000，反码为11111111111111111111111101111111，补码11111111111111111111111110000000
故char类型 a的补码为10000000
由于printf打印的类型为a的无符号整型，需要整型提升，a的无符号整型补码为11111111111111111111111110000000，由于为无符号整型，全为有效位，该二进制序列所对应的十进制数为4294967168.

在这里插入图片描述

3.
//输出什么？
#include<stdio.h>
int main()
{
	int i= -20;
	unsigned int j = 10;
	printf("%d\n", i+j);
    return 0;
}

分析：
按照补码的形式进行运算，最后格式化成为有符号整数
i的原码为10000000000000000000000000010100，反码11111111111111111111111111101011，补码11111111111111111111111111101100
j的原反补相同00000000000000000000000000001010，补码相加为11111111111111111111111111110110
对应的原码为10000000000000000000000000001010，以%d有符号数打印，故打印-10.

在这里插入图片描述

char类型取值范围的讨论

char的取值范围是-128~127

占1个字节，8个bit位，所以二进制补码序列可能方式有

00000000 对应的是0

00000001 对应的是1
… …
01111111 对应的是127
10000000 因为这一段序列不能减一，所以这一串序列会被直接解析为-128

10000001 对应的原码为11111111 对应的是-127

… …

11111111 对应的原码为10000001 对应的是-1

可以相当于一个圆，一半为正数，一半为负数，由0 – 127 --（-128）— 0，127的下一个被直接解析为-128，-128再逐渐增大到0，像一个轮回。

4.
//输出什么？
#include<stdio.h>
    
int main()
{
    char a[1000];
    int i;
    for(i=0; i<1000; i++)
   {
        a[i] = -1-i;
   }
    printf("%d",strlen(a));
    return 0;
}

在这里插入图片描述

分析：
因为数组a的类型为char类型，而char的取值范围是-128~127，如果赋给char类型
的值超过范围则会发生截断，实际以整型打印仍是在范围内的。
本题是由-1减小到-128，再到127，最后到0，再到-1，
第一次到0时数组长度为127+128 = 255,0为strlen的判断结束符，故最后打印255.

浮点型在内存中的存储（重难点）

浮点数家族包括： float、double、long double 类型。

浮点数存储的例子：

#include<stdio.h>

int main()
{
 	int n = 9;
	float *pFloat = (float *)&n;
    
 	printf("n的值为：%d\n",n);
 	printf("*pFloat的值为：%f\n",*pFloat);
    
 	*pFloat = 9.0;
	printf("num的值为：%d\n",n);
 	printf("*pFloat的值为：%f\n",*pFloat);
 	return 0;
}

在这里插入图片描述

输出是不是很出乎意料，想知道为什么吗？这就需要我们来深度了解浮点数在内存中的存储方式。

根据国际标准IEEE（电气和电子工程协会） 754：

任意一个二进制浮点数V可以表示成下面的形式： (-1)^S * M * 2^E ，(-1)^s表示符号位，当s=0，V为正数；当s=1，V为负数。 M表示有效数字，大于等于1，小于2。 2^E表示指数位。举例来说：十进制的5.0，写成二进制是 101.0 ，相当于 1.01×2^2 。那么，按照上面V的格式，可以得出s=0， M=1.01，E=2。

在这里插入图片描述

这就是两种浮点型变量在内存中的存储方式。

但是对于E和M有一些特别的规定：

对于M：

IEEE 754规定，在计算机内部保存M时，默认这个数的第一位总是1，因此可以被舍去，只保存后面的xxxxxx部分。比如保存1.01的时候，只保存01，等到读取的时候，再把第一位的1加上去。这样做的目的，是节省1位有效数字。以32位浮点数为例，留给M只有23位，将第一位的1舍去以后，等于可以保存24位有效数字。

对于E:

E不全为0或不全为1 这时，浮点数就采用下面的规则表示，即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第一位的1。比如： 0.5（1/2）的二进制形式为0.1，由于规定正数部分必须为1，即将小数点右移1位，则为1.0*2^(-1)，其阶码为-1+127=126，表示为01111110，而尾数1.0去掉整数部分为0，补齐0到23位 00000000000000000000000，则其二进制表示形式为

0 01111110 00000000000000000000000。

E为全0时，浮点数的指数E等于1-127（或者1-1023）即为真实值，有效数字M不再加上第一位的1，而是还原为 0.xxxxxx的小数。这样做是为了表示±0，以及接近于0的很小的数字。

E为全1时，这时，如果有效数字M全为0，表示±无穷大（正负取决于符号位s）。

例如 float n = 5.5; 5.5的二进制序列为101.1，小数点后一位的权重为2^(-1),以此类推。
5.5 = (-1)^0 * 1.011 * 2^2; S = 0, E = 2, M = 1.011
二进制序列为第一位为0，后八个bit位表示E，E要是想存入内存中，需要加上127，如果为double类型，则加上1023，序列为10000001，
后23位存储时只要小数点后面的011，后面补齐0到23位，故5.5在内存中存储的序列为01000000101100000000000000000000。

解释开头的题目

第一个打印是以整型的方式打印n，变量n就是整型定义下的10，故第一个打印的就是10.

第二个打印是以浮点数的形式打印*pFfloat，而指针变量pFloat是为把n的地址强制类型转换成float *得到的，n的原码为

00000000000000000000000000001010，转换成浮点型，即第一位0为S，后面八位全0为E，最后13位为M，当E为全0时，该数字为

0.xxxxx * 2^(-126)是一个非常小的数，而以浮点型打印只能精确到小数点后六位，所以打印为0.000000。

第三个打印是以整型的形式打印n，而n已经通过pFloat被改成了9.0，9.0 = (-1) ^ 0 * 1.001 * 2^3, 即 S = 0，M = 1.001，E = 3，

对应的原码为01000001000100000000000000000000。以整型形式打印即该二进制序列所对应的十进制数，由计算器算得

为1,091,567,616，与所打印相同。

第四个打印是以浮点数的形式打印*pFloat，而 *pFloat本来就是浮点型，故打印的就是9.0。

结尾

以上就是数据在内存中的存储方式，c语言中是按如此方式存储的，但是至于其他语言，小编暂时还不了解，如果有错误，还请不吝指正。看到这里也不容易，不如来个三连吧。在这里插入图片描述

lucas_dd

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度剖析数据在内存中的存储（c语言进阶）

文章目录数据类型的详细介绍整型家族浮点型家族构造类型指针类型整型在内存中的存储（重点）大小端字节序介绍及判断整型存储练习char类型取值范围的讨论浮点型在内存中的存储（重难点）结尾数据类型的详细介绍整型家族signed表示有符号类型，unsigned表示无符号类型charsigned charunsigned charshortsigned shortunsigned shortintsigned intunsigned intlongsigned long
复制链接

扫一扫

专栏目录