内存对齐

最新推荐文章于 2019-03-16 18:22:32 发布

吓人的鸟

最新推荐文章于 2019-03-16 18:22:32 发布

阅读量1.1k

点赞数

分类专栏：编程语言-c/c++ 文章标签：编译器 struct alignment c gcc

编程语言-c/c++ 专栏收录该内容

38 篇文章 1 订阅

订阅专栏

#include<stdio.h>
#pragma pack(2)
struct test_t
{
        int a;
        char b;
        short c;
        char d;
};
#pragma pack()

int main( int argc, char** argv)
{
        printf("sizeof(char)=%d\n",(int)sizeof(char));
        printf("sizeof(short)=%d\n",(int)sizeof(short));
        printf("sizeof(int)=%d\n",(int)sizeof(int));
        printf("sizeof(test_t)=%d\n",(int)sizeof(struct test_t));

        struct test_t test;
        printf("address of test_t.a = %ld\n", (long)(&test.a)-(long)&test);
        printf("address of test_t.b = %ld\n", (long)(&test.b)-(long)&test);
        printf("address of test_t.c = %ld\n", (long)(&test.c)-(long)&test);
        printf("address of test_t.d = %ld\n", (long)(&test.d)-(long)&test);
}

//输出
xudongsong@sysdev:~$ gcc -o struct_alignment struct_alignment.c ; ./struct_alignment 
sizeof(char)=1
sizeof(short)=2
sizeof(int)=4
sizeof(test_t)=10
address of test_t.a = 0
address of test_t.b = 4
address of test_t.c = 6
address of test_t.d = 8

百度文库的这篇文章写得简单却不够透彻 http://wenku.baidu.com/view/4ecfff70a417866fb84a8eed.html

下面这篇《GCC 对 #pragma pack(N) 的支持问题》写得乱七八糟的，但是说到重点了，所以转载过来，标红的是重点 http://hi.baidu.com/estellejiang/blog/item/371e46cb89aa5f13bf09e6aa.html

#pragma pack
这里重点讨论内存对齐的问题和#pragma pack（）的使用方法。
什么是内存对齐？
先看下面的结构：

struct TestStruct1
{
char c1;
short s;
char c2;
int i;
};

假设这个结构的成员在内存中是紧凑排列的，假设c1 的地址是0，那么s 的地址就应该是1，c2 的地址就是3，i 的地址就是4。也就是c1 地址为00000000, s 地址为00000001, c2地址为00000003, i 地址为00000004。可是，我们在Visual C++6.0 中写一个简单的程序：

struct TestStruct1 a;
printf("c1 %p, s %p, c2 %p, i %p\n",
(unsigned int)(void*)&a.c1 - (unsigned int)(void*)&a,
(unsigned int)(void*)&a.s - (unsigned int)(void*)&a,
(unsigned int)(void*)&a.c2 - (unsigned int)(void*)&a,
(unsigned int)(void*)&a.i - (unsigned int)(void*)&a);

运行，输出：
c1 00000000, s 00000002, c2 00000004, i 00000008。
为什么会这样？这就是内存对齐而导致的问题。

为什么会有内存对齐？
字，双字，和四字在自然边界上不需要在内存中对齐。（对字，双字，和四字来说，自然边界分别是偶数地址，可以被4 整除的地址，和可以被8 整除的地址。）无论如何，为了提高程序的性能，数据结构（尤其是栈）应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；然而，对齐的内存访问仅需要一次访问。
一个字或双字操作数跨越了4 字节边界，或者一个四字操作数跨越了8 字节边界，被认为是未对齐的，从而需要两次总线周期来访问内存。一个字起始地址是奇数但却没有跨越字边界被认为是对齐的，能够在一个总线周期中被访问。某些操作双四字的指令需要内存操作数在自然边界上对齐。如果操作数没有对齐，这些指令将会产生一个通用保护异常。双四字的自然边界是能够被16 整除的地址。其他的操作双四字的指令允许未对齐的访问（不会产生通用保护异常），然而，需要额外的内存总线周期来访问内存中未对齐的数据。
缺省情况下，编译器默认将结构、栈中的成员数据进行内存对齐。因此，上面的程序输出就变成了：c1 00000000, s 00000002, c2 00000004, i 00000008。编译器将未对齐的成员向后移，将每一个都成员对齐到自然边界上，从而也导致了整个结构的尺寸变大。尽管会牺牲一点空间（成员之间有部分内存空闲），但提高了性能。也正是这个原因，我们不可以断言sizeof(TestStruct1)的结果为8。在这个例子中，sizeof(TestStruct1)的结果为12。

如何避免内存对齐的影响
那么，能不能既达到提高性能的目的，又能节约一点空间呢？有一点小技巧可以使用。
比如我们可以将上面的结构改成：

struct TestStruct2
{
char c1;
char c2;
short s;
int i;
};

这样一来，每个成员都对齐在其自然边界上，从而避免了编译器自动对齐。在这个例子中，sizeof(TestStruct2)的值为8。这个技巧有一个重要的作用，尤其是这个结构作为API
的一部分提供给第三方开发使用的时候。第三方开发者可能将编译器的默认对齐选项改变，从而造成这个结构在你的发行的DLL 中使用某种对齐方式，而在第三方开发者哪里却使用另外一种对齐方式。这将会导致重大问题。
比如，TestStruct1 结构，我们的DLL 使用默认对齐选项，对齐为c1 00000000, s 00000002, c2 00000004, i 00000008，同时sizeof(TestStruct1)的值为12。而第三方将对齐选项关闭，导致c1 00000000, s 00000001, c2 00000003, i 00000004，同时sizeof(TestStruct1)的值为8。
除此之外我们还可以利用#pragma pack（）来改变编译器的默认对齐方式（当然一般编译器也提供了一些改变对齐方式的选项，这里不讨论）。
使用指令#pragma pack (n)，编译器将按照n 个字节对齐。
使用指令#pragma pack ()，编译器将取消自定义字节对齐方式。
在#pragma pack (n)和#pragma pack ()之间的代码按n 个字节对齐。
但是，成员对齐有一个重要的条件,即每个成员按自己的方式对齐.也就是说虽然指定了按n 字节对齐,但并不是所有的成员都是以n 字节对齐。其对齐的规则是,每个成员按其类型的对齐参数(通常是这个类型的大小)和指定对齐参数(这里是n 字节)中较小的一个对齐，即：min( n, sizeof( item )) 。并且结构的长度必须为所用过的所有对齐参数的整数倍,不够就补空字节。看如下例子：

#pragma pack(8)
struct TestStruct4
{
char a;
long b;
};
struct TestStruct5
{
char c;
TestStruct4 d;
long long e;
};
#pragma pack()

问题：
A),sizeof(TestStruct5) = ?
B), TestStruct5 的c 后面空了几个字节接着是d?
TestStruct4 中,成员a 是1 字节默认按1 字节对齐,指定对齐参数为8,这两个值中取1,a按1 字节对齐;成员b 是4 个字节,默认是按4 字节对齐,这时就按4 字节对齐,所以sizeof(TestStruct4)应该为8;TestStruct5 中,c 和TestStruct4 中的a 一样,按1 字节对齐,而d 是个结构,它是8 个字节,它按什么对齐呢? 对于结构来说,它的默认对齐方式就是它的所有成员使用的对齐参数中最大的一个, TestStruct4 的就是4.所以,成员d 就是按4 字节对齐.成员e 是8 个字节,它是默认按8字节对齐,和指定的一样,所以它对到8 字节的边界上,这时,已经使用了12 个字节了,所以又添加了4 个字节的空,从第16 个字节开始放置成员e.这时,长度为24,已经可以被8(成员e 按8字节对齐)整除.这样,一共使用了24 个字节.内存布局如下（*表示空闲内存，1 表示使用内存。单位为1byete）：
a b
TestStruct4 的内存布局：1***,1111,
c TestStruct4.a TestStruct4.b d
TestStruct5 的内存布局： 1***, 1***, 1111, ****，11111111
这里有三点很重要:
首先，每个成员分别按自己的方式对齐,并能最小化长度。
其次，复杂类型(如结构)的默认对齐方式是它最长的成员的对齐方式,这样在成员是复杂
类型时,可以最小化长度。
然后，对齐后的长度必须是成员中最大的对齐参数的整数倍,这样在处理数组时可以保
证每一项都边界对齐。
补充一下,对于数组,比如:char a[3];它的对齐方式和分别写3 个char 是一样的.也就是说
它还是按1 个字节对齐.如果写: typedef char Array3[3];Array3 这种类型的对齐方式还是按1
个字节对齐,而不是按它的长度。
但是不论类型是什么,对齐的边界一定是1,2,4,8,16,32,64....中的一个。
另外，注意别的#pragma pack 的其他用法：
#pragma pack(push) //保存当前对其方式到packing stack
#pragma pack(push,n) 等效于
#pragma pack(push)
#pragma pack(n) //n=1,2,4,8,16 保存当前对齐方式，设置按n 字节对齐
#pragma pack(pop) //packing stack 出栈，并将对其方式设置为出栈的对齐方

难道这个 pack 结果与 OS 也相关么？

说对了。默认的内存对齐方式以及内存对齐规则在不同的系统上是有区别的，所以GCC编译器在这一点上在不同的系统上也是区别对待的。

虽然到现在也没有看到GCC在Linux系统下的使用 #pragma pack(N) 的内存对齐规则，但是从我测试的结果来看是这样：默认的对齐是按照 int 型（4字节）对齐，如果指定 #pragma pack(N) 中的 N 的话，N 不能大于默认对齐指定的长度，即如果默认对齐是 4 的话，N的取值可以是 1、2、4，超过 4 之后作为 4 处理。在 Windows 等系统上似乎没有这个限制。

To adacu：

你引用的是在编译时使用 -fpack-struct[=n] 选项的情况。如果没有这个前提，你的说明是不正确的。

另外，现在讨论的是 #pragma pack，是另一种指示内存对齐的方式，你引用的内容不是解释这个情况的，所以说明不了楼主提出的问题。

吓人的鸟

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
内存对齐

#include#pragma pack(2)struct test_t{ int a; char b; short c; char d;};#pragma pack()int main( int argc, char** argv){ printf("sizeof(char)=%d\n",(int)s
复制链接

扫一扫

专栏目录