C-数据的存储-CSDN博客

本文链接：https://blog.csdn.net/m0_74293655/article/details/134184896

深度剖析数据在内存中的存储

1.数据类型详细介绍

前面我们已经学习了基本的内置类型：

char        //字符数据类型
short       //短整型
int         //整形
long        //长整型
long long   //更长的整形
float       //单精度浮点数
double      //双精度浮点数
//C语言有没有字符串类型？

以及他们所占存储空间的大小。
类型的意义：

使用这个类型开辟内存空间的大小（大小决定了使用范围）。
如何看待内存空间的视角。（类型决定数据看待及存储在内存空间中的方式）

相同的数值，在不同数据类型下在内存空间中存储形式由数据类型决定

1.1 类型的基本归类：

整形家族：

char
unsigned char
signed char
short
unsigned short [int]
signed short [int]
int
unsigned int
signed int
long
unsigned long [int]
signed long [int]

在这里插入图片描述

两种写法都正确

(unsigned) 无符号：八位二进制表示最高位不为符号位，无符号数最高位当作有效位不当作符号位，表示的范围也更大
(signed) 有符号：八位二进制表示最高位为符号位，1表示负，0表示正
如：11111111：最高位1为符号位，则(11111111)10=-127
最高位1为有效位，则(11111111)10=255
浮点数家族：

float
double

构造类型：

数组类型
结构体类型 struct
枚举类型 enum
联合类型 union

指针类型

int pi;
char pc;
float pf;
void pv;//无具体类型的的指针

空类型：

void 表示空类型（无类型）
通常应用于函数的返回类型、函数的参数、指针类型。

⒉.整形在内存中的存储:原码、反码、补码

2.1 原码、反码、补码

计算机中的整数有三种2进制表示方法，即原码、反码和补码。
三种表示方法均有符号位和数值位两部分，符号位都是用0表示“正”，用1表示“负”，而数值位
正数的原、反、补码都相同。
负整数的三种表示方法各不相同。

原码
直接将数值按照正负数的形式翻译成二进制就可以得到原码。
反码
整数原反补码相同，负数反码符号位不变，其余各位按位取反(0变1，1变0)
补码
(二进制形式)反码最后一位(最低位)+1就得到补码。

示例：
在这里插入图片描述

对于整形来说：数据存放内存中其实存放的是数据的补码。
为什么呢？

在计算机系统中，数值一律用补码来表示和存储。原因在于，使用补码，可以将符号位和数值域统
一处理；
同时，加法和减法也可以统一处理（CPU只有加法器）此外，补码与原码相互转换，其运算过程是相同的，不需要额外的硬件电路。

我们看看在内存中的存储：
在这里插入图片描述
这里可以观察到十六进制0x0000000a和0xfffffff6在内存中以0a 00 00 00和f6 ff ff ff形式存储，我们可以看到对于a和b分别存储的是补码。但是我们发现顺序有点不对劲。这是又为什么？
下面我们介绍数据在内存中的大小端字节序存储模式

2.2.大小端字节序介绍及判断

什么大端小端：大端字节序存储模式和小端字节序存储模式

大端（存储）模式，是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址中；
小端（存储）模式，是指数据的低位保存在内存的低地址中，而数据的高位,保存在内存的高地址中。

示例：
在这里插入图片描述

为什么有大端和小端：

为什么会有大小端模式之分呢？这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8 bit。但是在C语言中除了8 bit的char之外，还有16 bit的short型，32 bit的long型（要看具体的编译器），另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

例如：一个 16bit 的 short 型 x ，在内存中的地址为 0x0010 ， x 的值为 0x1122 ，那么 0x11 为高字节， 0x22 为低字节。对于大端模式，就将 0x11 放在低地址中，即 0x0010 中， 0x22 放在高地址中，即 0x0011 中。小端模式，刚好相反。我们常用的 X86 结构是小端模式，而 KEIL C51 则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

写一段代码判断当前机器是大端/小端存储：

//int check_sys() {
//	int a = 1;
//	char* p = (char*)&a;
//	return *p;
//}
//代码1
int check_sys() {
	int a = 1;
	return *((char*)&a);
}
int main() {
	int ret = check_sys();
	if (ret == 1) {
		printf("大端存储模式\n");
		}
	else {
		printf("小端存储模式\n");
	}
	return 0;
}
//代码2
int check_sys()
{
 union
 {
 int i;
 char c;
 }un;
 un.i = 1;
 return un.c;
}

变量a在内存中以补码形式存在：0x 00 00 08 01
大端存储00 00 00 01 4字节–>8比特位=8位二进制位=2位16进制位=1字节
小端存储01 00 00 00 4字节
在这里我们定义变量a,强制类型转换访问a的第一个字节的数据，如果p为0则为大端，p为1则为小端
前面我们学过指针能访问变量地址的字节大小由指针类型决定，如char能访问1字节数据，int能访问4字节数据
这里用char*访问a地址第一个字节的数据，对p解引用操作打印a地址上第一个字节的值

2.3几道小题目

1.
//输出什么？
#include <stdio.h>
int main()
{
     //整型提升：当有符号数按符号位补充--负数补1，无符号位直接补0
    char a= -1;
//原10000000 00000000 00000000 00000001
//反11111111 11111111 11111111 11111110
//补11111111 11111111 11111111 11111111  4字节
// char存放1字节，截断为11111111
//char类型a在以%d格式打印时发生整形提升，a补码为11111111，
//整型提升后为补码11111111111111111111111111111110，原码110000000 00000000 00000000 00000001，故a==-1
    signed char b=-1;
    unsigned char c=-1;
 //原10000000 00000000 00000000 00000001,补11111111 11111111 11111111 11111111
 //c存储1字节数据截断取补码低位的二进制位11111111
 //无符号整型提升高位补0，原00000000 00000000 00000000 11111111，c==255
    printf("a=%d,b=%d,c=%d",a,b,c);
    return 0;
}

答案：-1 -1 255
下面程序输出什么？

2.
#include <stdio.h>
int main()
{
    char a = -128;
    //原10000000 00000000 00000000 10000000，补11111111 11111111 11111111 10000000截断取补码高位11111111
    //11111111整形提升高位补1，整型提升后补码11111111 11111111 1111111 11111110
    //整型提升后原码为100000000 00000000 00000000 00000001，打印的是提升后的原码二进制转换成十进制
    printf("%u\n",a);
    //当我们使用 %u 来做转换规范时， printf会获取4字节的数据，并认为其为无符号整数 。
    return 0;
}

答案：4294967168

整型提升步骤：
1.首先写出原码，补码的二进制序列
2.对补码按数据类型截断，对截断后的二进制序列进行整型提升，得到的是整型提升后的补码
3.将整型提升后的补码转换成原码，最终打印结果的是整型提升后原码转换成十进制的结果
注意：%d打印有符号数十进制，若有符号数按%u格式打印成十进制，那么在打印是默认为其无符号整数，原符号位按有效位计算

3.
#include <stdio.h>
int main()
{
    char a = 128;
    //原00000000 00000000 00000000 10000000，补11111111 11111111 11111111 10000000截断取补码高位10000000
    //10000000整型提升为补码00000000 00000000 00000000 10000000，
    //整型提升后原码为011111111 11111111 11111111 01111111
    printf("%u\n",a);
    return 0;
}

答案：4294967168

4.
int main(){
int i= -20;
//原10000000 00000000 00000000 00010100，补11111111 11111111 11111111 11101100
unsigned  int  j = 10;
//原00000000 00000000 00000000 00001010
//补码相加得  11111111 11111111 11111111 11110110，原00000000 00000000 00000000 00001010
printf("%d\n", i+j); 
//按照补码的形式进行运算，最后格式化成为有符号整数
return 0;
}

答案：-10

5.
unsigned int i;
for(i = 9; i >= 0; i--)
{
    printf("%u\n",i);
    sleep(100);//睡眠100毫秒，0.1秒
}

答案：9 8 7 6 5 4 3 2 1 0 死循环（-1往后不断递减，将负数符号位当作有效位计算–unsigned int只能表示无符号整数）

6.
int main()
{
    char a[1000];
    int i;
    for(i=0; i<1000; i++)
   {
        a[i] = -1-i;
   }
    printf("%d",strlen(a));
    return 0;
}

答案：char[]类型数组只能存储-128~127之间的数字
-1~-128–>自-129开始到-1000会转换成0-127之间的数字，-129->128,-130->127…当遇到0时默认为字符串结尾，strlen停止统计字符数（'\0’标记字符串结尾，ascii码值为0),共存储-128-127之间的数字
255

7.
#include <stdio.h>
unsigned char i = 0;
int main()
{
    for(i = 0;i<=255;i++)
   {
        printf("hello world\n");
   }
    return 0;
}

答案：255

signed char类型可表示的数据范围：(类似一个环)
在这里插入图片描述
unsigned char数据类型可表示的范围：

各种数据类型的范围：

在这里插入图片描述

4.浮点型在内存中的存储解析

常见的浮点数：

3.14159
1E10
浮点数家族包括： float、double、long double 类型。
浮点数表示的范围：float.h中定义