内存对齐

最新推荐文章于 2023-01-06 16:20:19 发布

iteye_18480

最新推荐文章于 2023-01-06 16:20:19 发布

阅读量106

点赞数

文章标签： c/c++ 数据结构与算法内存管理

今天复习了一下内存对齐的知识，觉得有必要记录一下。

我想对于大部分非C/C++程序员，程序的内存布局对他们来说都是透明的，他们不需要关系编译器是如何进行程序的内存管理的。应该上层以及都把这些封装好了。内存对齐是属于编译器的工作，他把变量放到适合的内存位置中，以便程序能够高效率的存取这些变量，这是编译器实施内存对齐最主要的原因。

关于内存对齐的原因大部分的参考资料都说：

1、平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。

2、性能原因：数据结构应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。
对与性能原因可以通过下图Fig 1看出，这里没有考虑内存栈的扩展方向，以及字节顺序

Fig 1

如果对于int型的整数，假如等于0x01020304，如果编译器不进行内存对齐的话，它有可能存放在如图0x00FF00F2的位置，跨越了两个字，这样处理器在访问该变量时会访问两次内存，如果存放在0x00FF0000的位置，那么只需要访问一次内存。

下面来说一下内存对齐的规则：
不同平台上的不同编译器都有自己的对齐系数，可以通过预编译命令#pragma pack(n)，n=1,2,4,8,16来改变这一系数。

所以对于内存对齐最重要的原则：

1.数据所在的内存地址必须是该数据长度的整数倍；

2.结构体成员的长度依次与对齐系数比较，取两者较小值进行对齐；

3.在数据成员完成对齐后，结构体本身也要进行对齐，对齐的原则是：结构体的长度是最大数据成员的整数倍；

其中第一点是核心，是内存对齐的基本准则，2,3两点是关于结构体（类）对齐的规则

<1>结构体对齐

//编译器：gcc-4.1.2-48.el5
//平台:x86
struct testStruct1{
    char a;
    unsigned short b;
    int c;
    unsigned short d;
};

testStruct1 test1;
cout<<(void*)&test1.a<<endl;
cout<<(void*)&test1.b<<endl;
cout<<(void*)&test1.c<<endl;
cout<<(void*)&test1.d<<endl;
cout<<sizeof(testStruct1)<<endl;

//outcome
0xbfeb2b18//偏移0B
0xbfeb2b1a//相对结构体头偏移2B
0xbfeb2b1c//相对结构体头偏移4B
0xbfeb2b20//相对结构体头偏移8B
12

由结果可分析得出下图Fig2：

Fig 2

其中b的地址为0xbfeb2b1a，和a之间有一个未用的字节间隔，这是因为数据所在的内存地址必须是该数据长度的整数倍，结构体的长度为12，是因为按照对齐规则：结构体的长度是最大数据成员的整数倍

//编译器：gcc-4.1.2-48.el5
//平台:x86
struct testStruct2{  
    unsigned short a;
    char b;
    unsigned short c;
};

testStruct2 test2;
cout<<(void*)&test2.a<<endl;
cout<<(void*)&test2.b<<endl;
cout<<(void*)&test2.c<<endl;
cout<<sizeof(testStruct2)<<endl;

//outcome

0xbfeb2b12//偏移0B
0xbfeb2b14//相对结构体头偏移2B
0xbfeb2b16//相对结构体头偏移4B
6

由结果可分析得出下图Fig3：

Fig 3

由上面对齐关系可知，可知a,b,c的对齐结果，以及最后的结构体长度为6；

还有一些对齐规则的描述，但都是从上面三点衍生而来的，上面三点是核心的。

<2>类对齐

在C++中类其实和结构体基本上是一样的（除了成员的默认访问权限），下面补充一下两点

（1）空类（结构体）的大小

class test{

};
cout<<sizeof(test)<<endl;

//outcome
1//类的大小

空类（结构体）的大小为什么会是1呢，这是因为空类也是可以进行实例化的，实例化后生成的对象要保证在内存空间的唯一性，所以编译器就隐式在空类中增加一个字节，来保证这种需求。

（2）具有虚函数的类（结构体）的大小

class test{
 virtual void fun1();
 virtual void fun2();
};
cout<<sizeof(test)<<endl;

//outcome
4//类的大小

这里涉及到类关于虚成员函的实现，C++中的虚函数的实现一般是通过虚函数表（Virtual Table），而在有虚函数的类中分配了指向这个表的指针。这样设计是因为类的多态性。我们都知道在类中，多态性是通过虚函数的动态绑定来实现的。虚函数表是一段联系的内存空间，表中的每一行为指向类中一个虚成员函数的地址。

编译器应该是保证虚函数表的指针存在于对象实例中最前面的位置（这是为了保证取到虚函数表的有最高的性能——如果有多层继承或是多重继承的情况下）。这意味着可以通过对象实例的地址得到这张虚函数表，然后就可以遍历其中函数指针，并调用相应的函数。