【C++】结构体中的“内存对齐“现象

原创已于 2024-11-29 10:01:10 修改 · 1.5k 阅读

23 ·

CC 4.0 BY-SA版权

文章标签：

#c++ #开发语言 #c语言

于 2024-11-12 15:44:00 首次发布

C++初阶同时被 2 个专栏收录

11 篇文章

订阅专栏

计算机组成原理

4 篇文章

订阅专栏

一、现象引入

在之前谈到C++中类的大小的时候涉及到一个概念,即"内存对齐",今天我们来探讨一下具体什么是"内存对齐"。

现在我们可以先观察两组代码及其运行结果：

#include <stddef.h>  
#include <stdio.h>  

typedef struct {
    char a;      // 1 byte  
    int b;       // 4 bytes  
    short c;     // 2 bytes  
} AlignedStruct;

int main() {
    AlignedStruct s;

    printf("Size of AlignedStruct: %zu bytes\n", sizeof(s));
    printf("Offset of a: %zu\n", offsetof(AlignedStruct, a)); //a地址偏移量
    printf("Offset of b: %zu\n", offsetof(AlignedStruct, b)); //b地址偏移量 
    printf("Offset of c: %zu\n", offsetof(AlignedStruct, c)); //c地址偏移量

    return 0;
}

#include <stdio.h>  
#include <stddef.h>  

#pragma pack(push, 1) // 设置结构体的对齐方式  结构体的成员以 1 字节对齐
typedef struct {
    char a;      // 1 byte  
    int b;       // 4 bytes  
    short c;     // 2 bytes  
} AlignedStruct;
#pragma pack(pop) // 恢复默认的对齐方式  

int main() {
    AlignedStruct s;

    printf("Size of AlignedStruct: %zu bytes\n", sizeof(s));
    printf("Offset of a: %zu\n", offsetof(AlignedStruct, a)); //a地址偏移量  
    printf("Offset of b: %zu\n", offsetof(AlignedStruct, b)); //b地址偏移量
    printf("Offset of c: %zu\n", offsetof(AlignedStruct, c)); //c地址偏移量

    return 0;
}

我们可以观察到同样的结构体，只是因为多了两行代码就改变了结构体的大小和结构体中变量的内存偏移量。这便是因为两组代码应用了不同的“对齐参数”，在第一组中默认的“对齐参数”是“4”字节，在第二组中，我们手动将对其参数改为了“1”字节。

如图，这就是两组数据在内存中不同的存储方式。每个方框代表一字节大小的存储空间，黑色括号标注了变量占用的空间，红色括号标注了变量实际所占空间。

[图-结构体中变量的内存分布]

二、概念辨析

在C++中，内存对齐是指将数据元素的存储地址调整为特定边界的过程，这样做可以提高内存访问的效率。

三、内存对齐规则

内存对齐遵循一定规则：

第一个结构成员在对于结构体偏移量为0的地址处。
该结构体成员变量地址会统一到“对齐数”的整数倍的地址处（即使变量大小为4字节，如果对齐数是3字节的话，该结构体成员大小也会变为3的整数倍“6”）。
结构器总大小为：最大对齐数的整数倍。

以上规则都和“对齐数”有关吗，那么这个“对齐数”的大小该如何确定呢？一般情况下，所有变量类型中最大的一个，和编译器设置的默认对齐参数比较大小，取二者中较小的一个，即

struct test{
    char b;        //1
    int a;         //4
    long c;        //4 或 8
    long long d;   //8
};
对齐数 = min(sizeof(结构体中最大类型), sizeof(默认对齐参数));

此处我们假设结构体中最大变量是char类型的,编译器的默认对其参数是4字节,那么对齐数就是1字节,如果结构体中有long long类型的话,那么对齐数将会是8字节。

4、如果出现了嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

我们接下来看一下实例：

struct B {
    long long a; // 8 bytes
};

struct A {
    int x;       // 4 bytes
    char y;      // 1 byte
    struct B b;  // 8 bytes  
};

由于结构体B中只有一个long long类型的成员，因此结构体B的对齐数通常将是long long的对齐数是8字节。结构体A包含一个整型变量（int）、一个字符型变量（char）和一个结构体B类型的成员。我们已经知道结构体B的对齐数是8字节。然而，由于结构体A中包含一个对齐要求更高的成员（即结构体B），结构体A的整体对齐数将至少与结构体B的对齐数相同。因此，在不考虑编译器默认的对齐数的情况下，结构体A的对齐数也将是8字节。

对齐数 = 编译器默认的一个对齐数与该结构体成员中最大值中二者的较小值

VS中默认为8字节

对于实际大小,往往根据不同情况编译器会做出不同选择,但不论结果如何,最终目的还是要提高整体效率;

class A
{
	long a1;
	short a2;
	int a3;
	int* a4;//64位机器下是8字节,32位机器下是4字节
};

int main(void)
{
	std::cout << sizeof(A) << std::endl;//结果是24,所以这里对齐数选择了4
//在对齐数是4的情况下,可以做到空间利用和读取次数的总和提高
	return 0;
}

四、缘由探究

到此我们已经理解了什么是内存对齐，但是为什么要这样操作呢？我们通过图片可以很容易的观察出如果对齐数是1字节，那么对于内存的利用将会十分高效，省去了很多不必要的浪费，这就是很多同学的疑问。除了空间之外我们还要考虑到数据读取速度的问题。

（1）计算机读取规则的限制：

计算机在读取数据时通常为固定的大小，这样就导致及时我们将数据紧密排放，但是计算机在读取时仍然是这样的场景：

以第一组实验为例，在读取a时仍然是先读取了四个字节的数据，然后提取出来第一个字节的内容，在读取第二个数据b时仍然是读取前4个字节的数据然后提取出来中间两个字节的数据，在读取第三个数据就更复杂了，要提取两次数据然后再进行一次数据拼接。我们可以体会到这是一个复杂的过程，这样做极大地降低了计算机读取数据的效率。在如今存储空间已经没有那么稀缺了，没有必要为了小部分空间去降低速度，同样我们采用结构体中较小的值作为对其数，这样做已经可以减少大量的空间浪费了。