C/C++中结构体内存对齐(边界对齐),#pragma pack设置

先来看一段简单的程序,运行环境,x64位操作系统,visual studio 2019编译器:

#include <iostream>
using namespace std;

struct s1 {
    char a;
    int b;
} ss;

int main()
{
    cout << "sizeof(char):" << sizeof(ss.a) << endl;
    cout << "sizeof(int):" << sizeof(ss.b) << endl;
    cout << "sizeof(struct):" << sizeof(ss) << endl;
}

运行结果如下:

是不是和想象的不太一样,按照常理来说结构体中char成员占1字节,int成员占4字节,所以该及结构体总共应该占5字节内存大小, 但是实际情况却是该结构体占8字节内存,这是怎么回事呢?其实在内存中该结构体是这么存放的,如下图所示(蓝色:存储数据,白色:空闲):

这其实就是结构体中的内存对齐(边界对齐)

一、首先,为什么要进行内存对齐,即在内存中为什么要这么存放数据呢???

原因一:在内存中存放数据是为了给CPU使用,但是CPU从内存中读取数据并非是一个字节一个字节进行读取的,而是一块一块进行读取的,块的大小(具体和数据总线宽度等有关)称为内存读取粒度(memory granularity)。例如:CPU一次从内存读取8字节,而当一个int(4字节)存储在如下位置时,CPU如何获取该int值呢?

第一步:读取0x00~0x07, 8个字节,获取 int 的前两个字节;

第二步:读取0x08~0x0F, 8个字节,获取 int 的后两个字节;

可以看到,CPU从内存中读取int的四字节数据需要读取两次,大大降低了CPU效率。

原因二:有些硬件平台不能访问任意地址上的任意数据,遇到上述情况,会发生抛出异常或者发生程序崩溃等问题。

因此,为了提升效率、避免异常,就要进行内存对齐,也就是以空间换时间,提高效率。

二、结构体内存对齐的规则,即在内存中结构体数据是按照什么规则进行存放的。

规则一:结构体中元素是按照定义顺序,依次放入到内存中。在存放的过程中,每个成员按照一定的偏移量进行存放,其中第一个成员的偏移量为0,其余成员的偏移量是 对齐数 = min(编译器默认的数字,该成员的大小) 的整数倍(以结构体变量首地址为0计算)。即每个类型成员都会有一个属于自己的对齐数。visual studio中编译器默认的数字是8(windows),gcc默认是4(Linux)。

规则二:在经过规则一存放结构体中的数据后,计算总的存储单元是否是所有元素中最大对齐数的整数倍,是,则结束;不是,则补齐为它的整数倍。

注1:结构体中内存对齐是针对基本类型的(char,short,int,long,float,double等);

注2:对于含有指针的情况,只要记住指针本身所占的存储空间是4个字节就行了,而不必看它是指向什么类型的指针,见例4;

注3:对于含有数组的情况,按数组的类型对齐,如int a[2],则按照int类型对齐,见例5;

注4:对于含有其他结构体变量的情况,该结构体变量存储位置从自己的最大对齐数的整数倍处开始,而结构体的整体大小就是所有最大对齐数(含嵌套的结构体的对齐数)的整数倍,见例6。

三、当用户觉得默认的结构体对齐方式占用内存较大时,可使用预处理指令指定结构体的对齐方式

使用预处理指令#pragma pack(n)可以指定结构体的内存对齐方式,其中n的取值必须是2的幂次方,即1、2、4、8、16等;在没有参数的情况下调用pack会将n设置为编译器默认的数字。该指令成对出现的,用完后恢复默认值。

使用该指令后,实际对齐长度=Min(设置字节长度,结构体成员的大小);

若未使用该指令,实际对齐长度 = Min(编译器默认的数字,结构体成员的大小);

即该指令可以设置编译器默认的对齐数字,其余仍然按照规则一和规则二进行计算。

如下,该结构体变量的存储大小为5个字节:char类型变量的对齐数是1,存储在第0个字节,int类型变量的对齐数是1=Min(1,4),存储在第1-4字节,因此存储大小一共5个字节。

#pragma pack(1) 	//设置以1个字节为对齐长度
struct S {
 	char cb;
	int  ia;
}s;
#pragma pack ()  	//设置默认值为对齐长度

示例如下:

(1)如下结构体,先按照规则一进行存放。首先将字符型变量a存入第0个字节(该结构体在内存开辟的首地址,相对地址);然后再存放整形变量b时,会以4个字节为单位进行存储(对齐数为4=min(8, 4)),由于第一个四字节模块已有数据,因此它会存入第二个四字节模块,也就是存入到第4~7字节;存放双精度实型变量c时,会以8个字节为单位进行存储(对齐数为8=min(8, 8)),即会找到第一个空的且是8的整数倍的位置开始存储,此例中,由于头一个8字节模块已被占用,所以将c存入第二个8字节模块。最后按照规则二进行检查,总的存储单元为16个字节,是最大对齐数8的整数倍,所以结束。存储示意图如下图所示。

struct S{
    char a;
    int b;
    double c;
}S1;

 (2)首先按照规则一:字符型变量a存放在第0个字节,然后double存放在第8-15字节,int存放在第16-19字节;然后按照规则二:总的存储大小为20个字节,不是最大对齐数(double类型对齐数)的整数倍,所以末尾再补充四个字节,最终该结构体总的存储大小为24个字节。

struct S{
    char a;
    double c;
    int b;  
}S1;

 (3)首先按照规则一,double a存储在第0-7字节,char b存储在第8字节,int c存储在第12-15字节,char d存储在第16字节;再按照规则二,此时总的存储大小是17个字节,不是最大对齐数8的整数倍,所以进行补齐,最后总的存储大小为24个字节。

struct S{
    double a;
    char b;
    int c;
    char d;
}S1;

(4)结构体中含有指针变量的情况,三个结构体中含有不同类型的指针变量,其结构体大小都为4个字节,因此对于含有指针变量的结构体对于指针变量存储大小按照4个字节进行计算,然后计算其对齐数,然后再按照规则一和规则二进行对齐即可。如下s4的存储大小为8,存储示意图如下。

struct S1 {
    char *a;
} s1;

struct S2 {
    int *b;
} s2;

struct S3 {
    double* a;
} s3;

struct S4 {
    char a;
    double* b;
} s4;

(5) 含有数组的情况,按照数据的类型,进行对齐即可;char a存储在第0字节,int b[2]存储在第4-11字节。

struct S5 {
    char a;
    int b[2];
} s5;

(6) 含有其他结构体的情况,S2中char a存储在第0字节,然后因为结构体变量S1 b的最大对齐数是8,因此从第8个字节开始存储,存储在第8-23字节,然后按照规则二检查存储大小是否是最大对齐数的整数倍,满足,则结束(最大对齐数是8(double类型变量的对齐数),总的存储大小是24)。

struct S1 {
    char a;
    int b;
    double c;
};

struct S2 {
    char a;
    S1 b;
};
  • 15
    点赞
  • 37
    收藏
    觉得还不错? 一键收藏
  • 8
    评论
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值