结构体大小 --字节对齐分析

最新推荐文章于 2022-05-08 16:13:03 发布

mal327

最新推荐文章于 2022-05-08 16:13:03 发布

阅读量1k

点赞数

分类专栏： C/C++ 文章标签： struct 编译器 alignment 平台存储数据结构

C/C++ 专栏收录该内容

74 篇文章 2 订阅

订阅专栏

结构体大小 --字节对齐分析
本文来自：http://apps.hi.baidu.com/share/detail/6503863

对齐：

现代计算机中内存空间都是按照byte划分的，从理论上讲似乎对任何类型的变量的访问可以从任何地址开始，但实际情况是在访问特定变量的时候经常在特定的内存地址访问，这就需要各类型数据按照一定的规则在空间上排列，而不是顺序的一个接一个的排放，这就是对齐。

对齐的作用和原因：

各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。其他平台可能没有这种情况，但是最常见的是如果不按照适合其平台的要求对数据存放进行对齐，会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始，如果一个int型（假设为 32位）如果存放在偶地址开始的地方，那么一个读周期就可以读出，而如果存放在奇地址开始的地方，就可能会需要2个读周期，并对两次读出的结果的高低字节进行拼凑才能得到该int数据。显然在读取效率上下降很多。这也是空间和时间的博弈。

对齐的实现

通常，我们写程序的时候，不需要考虑对齐问题。编译器会替我们选择适合目标平台的对齐策略。当然，我们也可以通知给编译器传递预编译指令而改变对指定数据的对齐方法。缺省情况下，编译器为结构体的每个成员按其自然对界（natural alignment）条件分配空间。各个成员按照它们被声明的顺序在内存中顺序存储，第一个成员的地址和整个结构的地址相同。 自然对界(natural alignment)即默认对齐方式，是指按结构体的成员中size最大的成员对齐。
最常见的就是struct数据结构的sizeof结果，出乎意料。为此，我们需要对对齐算法所了解。

结构体的sizeof值,并不是简单的将其中各元素所占字节相加，而是要考虑到存储空间的字节对齐问题。先看下面定义的两个结构体.
struct s1
{
int a;
double b;
int c;
};
struct s2
{
int a;
int c;
double b;
};
sizeof(s1) = ?, sizeof(s2) = ?
结果：sizeof(s1) = 24，sizeof(s2) = 16
可见，虽然两个结构体所含的元素相同，但因为其中存放的元素类型顺序不一样，所占字节也出现差异。这就是字节对齐原因。
通过字节对齐，有助于加快计算机的取数速度，否则就得多花指令周期。

结构体默认的字节对齐一般满足三个准则：
1) 结构体变量的 首地址能够被其最宽基本类型成员的大小所整除；
2) 结构体 每个成员相对于结构体首地址的偏移量（offset）都是成员大小的整数倍，如有需要编译器会在成员之间加上填充字节（internal adding）；
3) 结构体的 总大小为结构体最宽基本类型成员大小的整数倍，如有需要编译器会在最末一个成员之后加上填充字节（trailing padding）。

通过这三个原则，就不难理解上面两个struct的差异了。
对于struct S1, 为了使double变量满足字节对其准则(2), 即其存储位置相对于结构体首地址的offset是自身大小(double占8个字节)的整数倍，必须在字节a后面填充4个字节以对齐；再由准则(3),为了满足结构体总大小为double大小的整数倍，必须再在c后面填充4个字节,从而它的字节数就是8*3=24。
对于struct S2, 却不必如上所述的填充字节，因为其直接顺序存储已经满足了对齐准则。

指定对界
一般地，可以通过下面的方法来改变缺省的对界条件：
使用伪指令#pragma pack (n)，编译器将按照n个字节对齐；
使用伪指令#pragma pack ()，取消自定义字节对齐方式。
注意： 如果#pragma pack (n)中指定的n大于结构体中最大成员的size，则其不起作用，结构体仍然按照size最大的成员进行对界。

结构体长度求法：
　　a.成员都相同时（或含数组且数组数据类型同结构体其他成员数据类型）：
　　结构体长度=成员数据类型长度×成员个数（各成员长度之和）;
　　结构体中数组长度=数组数据类型长度×数组元素个数；
　　b.成员不同且不含其它结构体时;
　　(1).分析各个成员长度；
　　(2).找出最大长度的成员长度M（结构体的长度一定是该成员的整数倍）；
　　(3).并按最大成员长度出现的位置将结构体分为若干部分；
　　(4).各个部分长度一次相加，求出大于该和的最小M的整数倍即为该部分长度
　　(5).将各个部分长度相加之和即为结构体长度
　　 c.含有其他结构体时：
　　(1).分析各个成员长度；
　　(2).对是结构体的成员，其长度按b来分析，且不会随着位置的变化而变化；
　　(3).分析各个成员的长度（成员为结构体的分析其成员长度），求出最大值；
　　(4).若长度最大成员在为结构体的成员中，则按结构体成员为分界点分界；
　　其他成员中有最大长度的成员，则该成员为分界点；
　　求出各段长度，求出大于该和的最小M的整数倍即为该部分长度
　　(5).将各个部分长度相加之和即为结构体长度

举例来说：

　　1.struct test1
　　{ int a;
　　 int b[4];
　　};
　　 sizeof(test1)=sizeof(int)+4*sizeof(int)=4+4*4=20;
　　2. struct test2
　　{ char a;
　　 int b;
　　 double c;
　　 bool d;
　　};
　　分析：该结构体最大长度double型，长度是8，因此结构体长度分两部分：
　　第一部分是a、 b、 c的长度和，长度分别为1，4，8，则该部分长度和为13，取8的大于13的最小倍数为16；
　　第二部分为d，长度为1，取大于1的8的最小倍数为8，
　　两部分和为24，故sizeof(test2)=24;
　　3. struct test3
　　{
　　 char a;
　　 test2 bb;//见上题
　　 int cc;
　　}
　　分析：该结构体有三个成员，其中第二个bb是类型为test2的结构体，长度为24，且该结构体最大长度成员类型为double型，以后成员中没有double型，所以按bb分界为两部分：
　　第一部分有a 、bb两部分，a长度为1，bb长度为24，取8的大于25的最小倍数32；
　　第二部分有cc，长度为4，去8的大于4的最小倍数为8；
　　两部分之和为40，故sizeof(test3)=40;
　　4. struct test4
　　{
　　 char a;
　　 int b;
　　};
　　struct test5
　　{ char c;
　　 test4 d;
　　 double e;
　　 bool f;
　　};
　　求sizeof(test5)
　　分析：test5明显含有结构体test4，按例2容易知道sizeof(test4)=8，且其成员最大长度为4;则结构体test5的最大成员长度为8(double 型)，考试.大提示e是分界点，分test5为两部分：
　　第一部分由c 、d、e组成，长度为1、8、8，故和为17，取8的大于17的最小倍数为24；
　　第二部分由f组成，长度为1，取8的大于1的最小倍数为8，
　　两部分和为32，故sizeof(test5)=24+8=32;
　　在VC6.0下程序验证结果是正确的。