C/C++中结构体内存对齐（边界对齐），#pragma pack设置

惟江上清风

已于 2022-06-15 19:04:08 修改

阅读量4.7k

点赞数 15

分类专栏： C++ 文章标签： c语言 c++ 开发语言

于 2022-01-16 22:10:10 首次发布

本文链接：https://blog.csdn.net/yangzhengzheng95/article/details/122529751

版权

C++ 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

先来看一段简单的程序，运行环境，x64位操作系统，visual studio 2019编译器：

#include <iostream>
using namespace std;

struct s1 {
    char a;
    int b;
} ss;

int main()
{
    cout << "sizeof(char):" << sizeof(ss.a) << endl;
    cout << "sizeof(int):" << sizeof(ss.b) << endl;
    cout << "sizeof(struct):" << sizeof(ss) << endl;
}

运行结果如下：

是不是和想象的不太一样，按照常理来说结构体中char成员占1字节，int成员占4字节，所以该及结构体总共应该占5字节内存大小，但是实际情况却是该结构体占8字节内存，这是怎么回事呢？其实在内存中该结构体是这么存放的，如下图所示（蓝色：存储数据，白色：空闲）：

这其实就是结构体中的内存对齐（边界对齐）。

一、首先，为什么要进行内存对齐，即在内存中为什么要这么存放数据呢？？？

原因一：在内存中存放数据是为了给CPU使用，但是CPU从内存中读取数据并非是一个字节一个字节进行读取的，而是一块一块进行读取的，块的大小（具体和数据总线宽度等有关）称为内存读取粒度（memory granularity）。例如：CPU一次从内存读取8字节，而当一个int（4字节）存储在如下位置时，CPU如何获取该int值呢？

第一步：读取0x00~0x07， 8个字节，获取 int 的前两个字节；

第二步：读取0x08~0x0F， 8个字节，获取 int 的后两个字节；

可以看到，CPU从内存中读取int的四字节数据需要读取两次，大大降低了CPU效率。

原因二：有些硬件平台不能访问任意地址上的任意数据，遇到上述情况，会发生抛出异常或者发生程序崩溃等问题。

因此，为了提升效率、避免异常，就要进行内存对齐，也就是以空间换时间，提高效率。

二、结构体内存对齐的规则，即在内存中结构体数据是按照什么规则进行存放的。

规则一：结构体中元素是按照定义顺序，依次放入到内存中。在存放的过程中，每个成员按照一定的偏移量进行存放，其中第一个成员的偏移量为0，其余成员的偏移量是 对齐数 = min(编译器默认的数字，该成员的大小) 的整数倍（以结构体变量首地址为0计算）。即每个类型成员都会有一个属于自己的对齐数。visual studio中编译器默认的数字是8（windows），gcc默认是4（Linux）。

规则二：在经过规则一存放结构体中的数据后，计算总的存储单元是否是所有元素中最大对齐数的整数倍，是，则结束；不是，则补齐为它的整数倍。

注1：结构体中内存对齐是针对基本类型的（char，short，int，long，float，double等）；

注2：对于含有指针的情况，只要记住指针本身所占的存储空间是4个字节就行了，而不必看它是指向什么类型的指针，见例4；

注3：对于含有数组的情况，按数组的类型对齐，如int a[2]，则按照int类型对齐，见例5；

注4：对于含有其他结构体变量的情况，该结构体变量存储位置从自己的最大对齐数的整数倍处开始，而结构体的整体大小就是所有最大对齐数（含嵌套的结构体的对齐数）的整数倍，见例6。

三、当用户觉得默认的结构体对齐方式占用内存较大时，可使用预处理指令指定结构体的对齐方式

使用预处理指令#pragma pack（n）可以指定结构体的内存对齐方式，其中n的取值必须是2的幂次方，即1、2、4、8、16等；在没有参数的情况下调用pack会将n设置为编译器默认的数字。该指令成对出现的，用完后恢复默认值。

使用该指令后，实际对齐长度=Min（设置字节长度，结构体成员的大小）；

若未使用该指令，实际对齐长度 = Min（编译器默认的数字，结构体成员的大小）；

即该指令可以设置编译器默认的对齐数字，其余仍然按照规则一和规则二进行计算。

如下，该结构体变量的存储大小为5个字节：char类型变量的对齐数是1，存储在第0个字节，int类型变量的对齐数是1=Min(1,4），存储在第1-4字节，因此存储大小一共5个字节。

#pragma pack(1) 	//设置以1个字节为对齐长度
struct S {
 	char cb;
	int  ia；
}s;
#pragma pack ()  	//设置默认值为对齐长度

示例如下：

（1）如下结构体，先按照规则一进行存放。首先将字符型变量a存入第0个字节（该结构体在内存开辟的首地址，相对地址）；然后再存放整形变量b时，会以4个字节为单位进行存储（对齐数为4=min(8, 4)），由于第一个四字节模块已有数据，因此它会存入第二个四字节模块，也就是存入到第4~7字节；存放双精度实型变量c时，会以8个字节为单位进行存储（对齐数为8=min(8, 8)），即会找到第一个空的且是8的整数倍的位置开始存储，此例中，由于头一个8字节模块已被占用，所以将c存入第二个8字节模块。最后按照规则二进行检查，总的存储单元为16个字节，是最大对齐数8的整数倍，所以结束。存储示意图如下图所示。

struct S{
    char a;
    int b;
    double c;
}S1;

（2）首先按照规则一：字符型变量a存放在第0个字节，然后double存放在第8-15字节，int存放在第16-19字节；然后按照规则二：总的存储大小为20个字节，不是最大对齐数（double类型对齐数）的整数倍，所以末尾再补充四个字节，最终该结构体总的存储大小为24个字节。

struct S{
    char a;
    double c;
    int b;  
}S1;

（3）首先按照规则一，double a存储在第0-7字节，char b存储在第8字节，int c存储在第12-15字节，char d存储在第16字节；再按照规则二，此时总的存储大小是17个字节，不是最大对齐数8的整数倍，所以进行补齐，最后总的存储大小为24个字节。

struct S{
    double a;
    char b;
    int c;
    char d;
}S1;

（4）结构体中含有指针变量的情况，三个结构体中含有不同类型的指针变量，其结构体大小都为4个字节，因此对于含有指针变量的结构体对于指针变量存储大小按照4个字节进行计算，然后计算其对齐数，然后再按照规则一和规则二进行对齐即可。如下s4的存储大小为8，存储示意图如下。

struct S1 {
    char *a;
} s1;

struct S2 {
    int *b;
} s2;

struct S3 {
    double* a;
} s3;

struct S4 {
    char a;
    double* b;
} s4;

（5）含有数组的情况，按照数据的类型，进行对齐即可；char a存储在第0字节，int b[2]存储在第4-11字节。

struct S5 {
    char a;
    int b[2];
} s5;

（6）含有其他结构体的情况，S2中char a存储在第0字节，然后因为结构体变量S1 b的最大对齐数是8，因此从第8个字节开始存储，存储在第8-23字节，然后按照规则二检查存储大小是否是最大对齐数的整数倍，满足，则结束（最大对齐数是8（double类型变量的对齐数），总的存储大小是24）。

struct S1 {
    char a;
    int b;
    double c;
};

struct S2 {
    char a;
    S1 b;
};

惟江上清风

关注

15
点赞
踩
38

收藏

觉得还不错? 一键收藏
8
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录