C语言深度剖析：数据在内存中的存储

最新推荐文章于 2025-03-30 17:19:34 发布

原创

最新推荐文章于 2025-03-30 17:19:34 发布 · 1k 阅读

26 ·

CC 4.0 BY-SA版权

文章标签：

#c语言 #arm开发 #开发语言

C语言深度剖析：数据在内存中的存储

一、大小端模式：多字节数据在内存中的存储顺序

在计算机系统中，大小端模式（Big-Endian 和 Little-Endian）是指多字节数据在内存中的存储顺序。理解大小端模式对跨平台开发、数据传输以及性能优化都非常重要。

1. 什么是大小端？

假设有一个32位整数 0x12345678，它的二进制表示为：

0x12345678 = 0001 0010 0011 0100 0101 0110 0111 1000

由于整数占4字节（32位），我们需要将它依次存储在内存的不同地址上。那么：

大端模式（Big Endian）：高字节存储在低地址处。
小端模式（Little Endian）：低字节存储在低地址处。

内存存储示例

假设变量 x 值为 0x12345678，存储从地址 0x1000 开始：

大端模式（Big Endian）：

地址      数据
0x1000    0x12
0x1001    0x34
0x1002    0x56
0x1003    0x78

小端模式（Little Endian）：

地址      数据
0x1000    0x78
0x1001    0x56
0x1002    0x34
0x1003    0x12

2. 为什么会有大小端模式？

(1) 硬件架构的差异

小端模式最早由Intel处理器采用，主要用于x86架构（如PC）。
大端模式通常由一些大数据服务器、网络协议、以及Motorola等处理器使用。

不同的计算机体系结构决定了如何在内存中存储数据。随着时间推移，不同厂商选择了不同的模式，因此世界上存在大端和小端的混用。

(2) 历史原因

大端模式类似于人类的阅读习惯（从左到右、高位到低位），因此一些早期计算机系统（如 Motorola 68000 系列）采用大端存储。
小端模式在处理运算时更高效，尤其是在加载和解析多字节数据时表现更好。因此，Intel 系列的处理器普遍采用了小端模式。

3. 大小端的作用与意义

(1) 数据传输中的一致性

网络协议通常采用大端模式，又称网络字节序（Network Byte Order），以确保不同系统之间数据传输的一致性。常见的网络协议如TCP/IP都规定多字节整数采用大端格式。

(2) 提高数据处理效率

小端模式在处理器加载字节时有优势：可以直接取低地址开始的字节，而不用调整数据顺序。这使得小端模式在一些低级硬件操作中效率更高。
例如，在取出一个16位数据的低8位时，小端模式不需要额外的字节偏移计算。

4. 大小端检测及应用

如何检测系统的大小端模式？

可以通过代码检测当前系统的字节序：

#include <stdio.h>

int main() {
   
   
    unsigned int x = 0x12345678;
  	// 将整数 x 的地址转化为字符指针 p，只访问最低地址字节。
    unsigned char *p = (unsigned char *)&x;
		// 如果最低地址字节是0x78，说明系统是小端模式；否则为大端模式。
    if (*p == 0x78) {
   
   
        printf("小端模式\n");
    } else {
   
   
        printf("大端模式\n");
    }
    return 0;
}

5. 大小端转换

在跨平台开发或网络数据传输中，经常需要在大小端之间转换数据。C语言提供了一些函数来处理字节序问题：

#include <arpa/inet.h> // 包含网络字节序转换函数

int main() {
   
   
    unsigned int host_num = 0x12345678;

    // 主机字节序转换为网络字节序（大端）
    unsigned int net_num = htonl(host_num);

    printf("网络字节序：0x%x\n", net_num);
    return 0;
}

htonl：将主机字节序转换为网络字节序（大端）。
ntohl：将网络字节序（大端）转换为主机字节序。

6. 大小端对性能的影响

小端模式的优势：
1. 加载和存储高效：取低字节时无需偏移操作。
2. 适合小数据类型的运算：如16位或8位的数据操作。
大端模式的优势：
1. 易于人类理解：高位字节放在低地址，类似于我们平时的书写习惯。
2. 适合网络传输：保证数据传输时的字节序一致性。

二、整数类型的存储详解

1. 有符号整数（`signed int`）

大小：通常为4字节（32位），不同平台可能存在差异（如16位、64位系统）。
范围：
- 最大值： $2^{31} - 1 = 2,147,483,647$
- 最小值： $2^{31} = -2,147,483,648$
存储方式：使用二进制补码（Two’s Complement）。

二进制补码表示法

补码是一种处理有符号数的二进制表示法，使计算机可以用相同的电路进行加法和减法运算。

正数的补码

表示：正数的补码与其原码（直接的二进制表示）相同。
高位补0：符号位（最高位）为0，表示正数。

示例：+5的32位二进制表示：

00000000 00000000 00000000 00000101

负数的补码计算

取绝对值的二进制表示。
按位取反（0变1，1变0）。
加1，得到最终的补码。

示例：存储`-5`的32位二进制补码

绝对值的二进制形式（+5的二进制表示）：
```
00000000 00000000 00000000 00000101
```
按位取反：
```
11111111 11111111 11111111 11111010
```
加1：
```
11111111 11111111 11111111 11111011
```

因此，-5的32位二进制补码表示为：

11111111 11111111 11111111 11111011

负数的解码

如果我们看到补码 11111111 11111111 11111111 11111011，如何解码？

按位取反：
```
00000000 00000000 00000000 00000100
```
加1：
```
00000000 00000000 00000000 00000101
```
符号为负：结果为-5。

补码的优势

统一加减法：补码让加法和减法共用同一电路。例如：
```
5 + (-5) = 0
```
避免二义性：不存在+0和-0的歧义。
简化溢出处理：整数溢出时自动环绕。

示例：溢出

int a = 2147483647;  // 最大int值
a = a + 1;  // 溢出
printf("%d\n", a);  // 输出-2147483648

2. 无符号整数（`unsigned int`）

大小：通常为4字节（32位）。
表示范围：0 到 $2^{32} - 1$ 。
- 最大值：4,294,967,295
- 最小值：0
存储方式：直接使用二进制表示，不包含符号位。

无符号整数的存储

无符号整数将32位全部用于表示数值，不涉及符号。

示例：5的32位无符号二进制表示：

00000000 00000000 00000000 00000101

运算与溢出

由于无符号整数的表示范围是0到 $2^{32} - 1$ ，在发生溢出时，结果将环绕到0。

最低0.47元/天解锁文章

C语言深度剖析：数据在内存中的存储

C语言深度剖析：数据在内存中的存储

一、大小端模式：多字节数据在内存中的存储顺序

1. 什么是大小端？

内存存储示例

2. 为什么会有大小端模式？

(1) 硬件架构的差异

(2) 历史原因

3. 大小端的作用与意义

(1) 数据传输中的一致性

(2) 提高数据处理效率

4. 大小端检测及应用

如何检测系统的大小端模式？

5. 大小端转换

6. 大小端对性能的影响

二、整数类型的存储详解

1. 有符号整数（signed int）

二进制补码表示法

正数的补码

负数的补码计算

示例：存储-5的32位二进制补码

负数的解码

补码的优势

示例：溢出

2. 无符号整数（unsigned int）

无符号整数的存储

运算与溢出

1. 有符号整数（`signed int`）

示例：存储`-5`的32位二进制补码

2. 无符号整数（`unsigned int`）