内存对齐详解

最新推荐文章于 2021-11-04 16:21:04 发布

梧桐木木

最新推荐文章于 2021-11-04 16:21:04 发布

阅读量428

点赞数

分类专栏： C++语言

C++语言专栏收录该内容

18 篇文章 0 订阅

订阅专栏

原文：

http://www.voidcn.com/blog/u013593585/article/p-5761676.html

http://mrcelite.blog.51cto.com/2977858/1757575

内存地址对齐，是一种在计算机内存中排列数据（表现为变量的地址）、访问数据（表现为CPU读取数据）的一种方式，包含了两种相互独立又相互关联的部分：基本数据对齐和结构体数据对齐。

为什么需要内存对齐？对齐有什么好处？是我们程序员来手动做内存对齐呢？还是编译器在进行自动优化的时候完成这项工作？

在现代计算机体系中，每次读写内存中数据，都是按字（word，4个字节，对于X86架构，系统是32位，数据总线和地址总线的宽度都是32位，所以最大的寻址空间为232 = 4GB（也许有人会问，我的32位XP用不了4GB内存，关于这个不在本篇博文讨论范围），按A[31,30…2,1,0]这样排列，但是请注意为了CPU每次读写 4个字节寻址，A[0]和A[1]两位是不参与寻址计算的。）为一个块（chunks）来操作（而对于X64则是8个字节为一个快）。注意，这里说的 CPU每次读取的规则，并不是变量在内存中地址对齐规则。既然是这样的，如果变量在内存中存储的时候也按照这样的对齐规则，就可以加快CPU读写内存的速度，当然也就提高了整个程序的性能，并且性能提升是客观，虽然当今的CPU的处理数据速度(是指逻辑运算等,不包括取址)远比内存访问的速度快，程序的执行速度的瓶颈往往不是CPU的处理速度不够，而是内存访问的延迟，虽然当今CPU中加入了高速缓存用来掩盖内存访问的延迟，但是如果高密集的内存访问，一种延迟是无可避免的，内存地址对齐会给程序带来了很大的性能提升。

内存地址对齐是计算机语言自动进行的，也即是编译器所做的工作。但这不意味着我们程序员不需要做任何事情，因为如果我们能够遵循某些规则，可以让编译器做得更好，毕竟编译器不是万能的。

为了更好理解上面的意思，这里给出一个示例。在32位系统中，假如一个int变量在内存中的地址是0x00ff42c3,因为int是占用4个字节，所以它的尾地址应该是0x00ff42c6，这个时候CPU为了读取这个int变量的值，就需要先后读取两个word大小的块，分别是0x00ff42c0~0x00ff42c3和0x00ff42c4~0x00ff42c7，然后通过移位等一系列的操作来得到，在这个计算的过程中还有可能引起一些总线数据错误的。但是如果编译器对变量地址进行了对齐，比如放在0x00ff42c0，CPU就只需要一次就可以读取到，这样的话就加快读取效率。

1、基本数据对齐
在X86，32位系统下基于Microsoft、Borland和GNU的编译器，有如下数据对齐规则：
a、一个char（占用1-byte）变量以1-byte对齐。
b、一个short（占用2-byte）变量以2-byte对齐。
c、一个int（占用4-byte）变量以4-byte对齐。
d、一个long（占用4-byte）变量以4-byte对齐。
e、一个float（占用4-byte）变量以4-byte对齐。
f、一个double（占用8-byte）变量以8-byte对齐。
g、一个long double（占用12-byte）变量以4-byte对齐。
h、任何pointer（占用4-byte）变量以4-byte对齐。

而在64位系统下，与上面规则对比有如下不同：
a、一个long（占用8-byte）变量以8-byte对齐。
b、一个double（占用8-byte）变量以8-byte对齐。
c、一个long double（占用16-byte）变量以16-byte对齐。
d、任何pointer（占用8-byte）变量以8-byte对齐。

2、结构体数据对齐
结构体数据对齐，是指结构体内的各个数据对齐。在结构体中的第一个成员的首地址等于整个结构体的变量的首地址，而后的成员的地址随着它声明的顺序和实际占用的字节数递增。为了总的结构体大小对齐，会在结构体中插入一些没有实际意思的字符来填充（padding）结构体。

对齐规则

每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。程序员可以通过预编译命令#pragma pack(n)，n=1,2,4,8,16来改变这一系数，其中的n就是你要指定的“对齐系数”。

规则：

1、数据成员对齐规则：结构(struct)(或联合(union))的数据成员，第一个数据成员放在offset为0的地方，以后每个数据成员的对齐按照#pragma pack指定的数值和这个数据成员自身长度中，比较小的那个进行。

2、结构(或联合)的整体对齐规则：在数据成员完成各自对齐之后，结构(或联合)本身也要进行对齐，对齐将按照#pragma pack指定的数值和结构(或联合)最大数据成员长度中，比较小的那个进行。

在结构体中，成员数据对齐满足以下规则：
a、结构体中的第一个成员的首地址也即是结构体变量的首地址。
b、结构体中的每一个成员的首地址相对于结构体的首地址的偏移量（offset）是该成员数据类型大小的整数倍。（如果结构体中有结构体变量，其结构体变量的首地址为其最长基本类型成员的整数倍）
c、结构体的总大小是对齐模数（对齐模数等于#pragma pack(n)所指定的n与结构体中最大数据类型的成员大小的最小值）的整数倍。

7: struct

8: {
9: char a;
10: int b;
11: short c;
12: char d;
13: }dataAlign;
14:
15: struct
16: {
17: char a;
18: char d;
19: short c;
20: int b;
21:
22: }dataAlign2;

仔细观察，会发现虽然是一样的数据类型的成员，只不过声明的顺序不同，结构体占用的大小也不同，一个8-byte一个12-byte。为什么这样，下面进行具体分析。以上两个列子没有给出 pragma pack(n)，n是vc中默认的大小。
首先来看dataAlign2，第一个成员的地址等于结构体变量的首地址，第二个成员char类型，为了满足规则b，它相对于结构体的首地址的偏移量必须是char=1的倍数，由于前面也是char，故不需要在第一个和第一个成员之间填充，直接满足条件。第三个成员short=2如果要满足规则b，也不需要填充，因为它的偏移量已经是2。同样第四个也因为偏移量int=4，不需要填充，这样结构体总共大小为8-byte。最后来验证规则c，在VC中默认的#pragma pack(n)中的n=8 ，而结构体中数据类型大小最大的为第四个成员int=4，故对齐模数为4,并且8 mode 4 = 0，所以满足规则c。这样整个结构体的总大小为8。

对于dataAlign，第一个成员等于结构体变量首地址，偏移量为0，第二个成员为int=4，为了满足规则b，需要在第一个成员之后填充3-byte，让它相对于结构体首地址偏移量为4，结合运行结果，可知&dataAlign.a = 0x01109140，而&dataAlign.b = 0x01109144，它们之间相隔4-byte，0x01109141~0x01109143三个字节被0填充。第三个成员short=2，无需填充满足规则b。第四个成员char=1，也不需要填充。结构体总大小相加4 + 4 + 2 + 1 = 11。同样最后需要验证规则c，结构体中数据类型大小最大为第二个成员int=4，比VC默认对齐模数8小，故这个结构体的对齐模数仍然为4，显然11 mode 4 != 0，故为了满足规则c，需要在char后面填充一个字节，这样结构体变量dataAlign的总大小为4 + 4 + 2 + 2 =12

二、#pragma pack(n)来设定变量以n字节对齐方式

VC对结构的存储的特殊处理确实提高CPU存储变量的速度，但是有时候也带来了一些麻烦，我们也屏蔽掉变量默认的对齐方式，自己可以设定变量的对齐方式。VC 中提供了#pragma pack(n)来设定变量以n字节对齐方式。n字节对齐就是说变量存放的起始地址的偏移量有两种情况：

第一、如果n大于等于该变量所占用的字节数（x），那么偏移量必须满足默认的对齐方式；(x<=n,偏移量为x的倍数)

第二、如果n小于该变量的类型所占用的字节数，那么偏移量为n的倍数，不用满足默认的对齐方式。（x>n，偏移量为n的倍数）

第三. 整体对齐为：min((max(结构体中数据成员类型), n) 的整数倍。

结构的总大小也有个约束条件，分下面两种情况：如果n大于所有成员变量类型所占用的字节数，那么结构的总大小必须为占用空间最大的变量占用的空间数的倍数；否则必须为n的倍数。下面举例说明其用法：

#pragma pack(push) //保存对齐状态 #pragma pack(4)//设定为4字节对齐 struct test 
{ 
　　char m1; 
　　double m4; 
　　int m3; 
}; 
#pragma pack(pop)//恢复对齐状态

以上结构的大小为16，下面分析其存储情况，首先为m1分配空间，其偏移量为0，满足我们自己设定的对齐方式（4字节对齐），m1占用1个字节。接着开始为 m4分配空间，这时其偏移量为1，需要补足3个字节，这样使偏移量满足为n=4的倍数（因为sizeof(double)大于n）,m4占用8个字节。接着为m3分配空间，这时其偏移量为12，满足为4的倍数，m3占用4个字节。这时已经为所有成员变量分配了空间，共分配了4+8+4=16个字节，满足为n的倍数。如果把上面的#pragma pack(4)改为#pragma pack(16)，那么我们可以得到结构的大小为24。

再看下面这个例子：

#pragma pack(8)struct S1{    char a;    long b;
};

struct S2 {    char c;    struct S1 d;    long long e;
};#pragma pack()

成员对齐有一个重要的条件,即每个成员分别对齐.即每个成员按自己的方式对齐.

也就是说上面虽然指定了按8字节对齐,但并不是所有的成员都是以8字节对齐.其对齐的规则是,每个成员按其类型的对齐参数(通常是这个类型的大小)和指定对齐参数(这里是8字节)中较小的一个对齐.并且结构的长度必须为所用过的所有对齐参数的整数倍,不够就补空字节.

S1中,成员a是1字节默认按1字节对齐,指定对齐参数为8,这两个值中取1,a按1字节对齐;成员b是4个字节,默认是按4字节对齐,这时就按4字节对齐,所以sizeof(S1)应该为8;

S2 中,c和S1中的a一样,按1字节对齐,而d 是个结构,它是8个字节,它按什么对齐呢?对于结构来说,它的默认对齐方式就是它的所有成员使用的对齐参数中最大的一个,S1的就是4.所以,成员d就是按4字节对齐.成员e是8个字节,它是默认按8字节对齐,和指定的一样,所以它对到8字节的边界上,这时,已经使用了12个字节了,所以又添加了4个字节的空,从第16个字节开始放置成员e.这时,长度为24,已经可以被8(成员e按8字节对齐)整除.这样,sizeof(S2)为24个字节.

梧桐木木

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
内存对齐详解

原文：http://www.voidcn.com/blog/u013593585/article/p-5761676.htmlhttp://mrcelite.blog.51cto.com/2977858/1757575内存地址对齐，是一种在计算机内存中排列数据（表现为变量的地址）、访问数据（表现为CPU读取数据）的一种方式，包含了两种相互独立又相互关联的部分：基本数据对齐和结构
复制链接

扫一扫