刚刚完成一个文件的迁移程序,其中遇到了结构体对齐的问题,所以拿出来说说,与各位博友们分享。
我的程序很简单,就是把之前通过一个结构体fwrite到文件A里的内容读出,然后转给另一个结构体保存。程序是简单,但我担心的是之前把结构体fwrite到文件A的程序对齐结构体规则是怎样的?一定要知道它吗? 当然了,如果那个程序结构体是按照1对齐写入的,我的程序结构体是按照4对齐读入,那不就糟了!
这里我引入结构体对齐的概念,也可以说是内存对齐了。为什么要内存对齐呢,就是方便CPU寻址了,具体原因大家要参考计算机体系结构了。先看一个内存对齐的例子:
struct example1{
char a;
double b;
long l;
};
struct example2{
char a;
long l;
double b;
};
大家算算结构体大小,初次接触的博友可能对答案有点惊讶,VC编译, sizeof后结果分别是:24,16。 同样是的结构体,成员换了顺序,大小就不同了。其实内存对齐有个规则,只要知道了,就OK。那么以下5点是关键
1. 内存对齐与编译器设置有关,首先要搞清编译器这个默认值是多少
2. 如果不想编译器默认的话,可以通过#pragma pack(n)来指定按照n对齐
3. 每个结构体变量对齐,如果对齐参数n(编译器默认或者通过pragma指定)大于该变量所占字节数(m),那么就按照m对齐,内存偏移后的地址是m的倍数,否则是按照n对齐,内存偏移后的地址是n的倍数。也就是最小化长度规则
4. 结构体总大小: 对齐后的长度必须是成员中最大的对齐参数的整数倍。最大对齐参数是从第三步得到的。
5. 补充:如果结构体A中还要结构体B,那么B的对齐方式是选它里面最长的成员的对齐方式
所以计算结构体大小要走三步,首先确定是当前程序按照几对齐(参照1,2点),接着计算每个结构体变量的大小和偏移(参照3,5),最后计算结构体总大小(参照4)。
先算算example1吧,假设编译器是以16对齐的
1.确定按照几对齐: 16;
2.确定每个成员的偏移:a 占一个字节,16>1, 按照1对齐,起始位置0,0%1 = 0,那么a就存在0位置;b占8个字节,16>8,按照8对齐,起始位置就不能是1了,因为要按照8对齐,所以最近的偏移起始位置是8, 8%8 =0, 那么b就存在位置8-15的位置;l占4个字节,16>4,按照4对齐,起始位置16, 16%4=0,那么l就存在位置16-19的位置。所以结构体从0到19一共占用20个字节
3.结构体总大小:成员中最大的对齐参数是b的8对齐,所以20%8!=0, 24刚好。
真的很搞!同理计算example2应该是16;
再举个结构体嵌套的例子吧,
#pragma pack(push)
#pragma pack(8)
struct test1{
int a;
char b;
int c[20]
long l;
} ;
struct test2{
char a1;
char a2;
struct test1 t1;
double b1;
}
#pragma pack(pop)
先计算test1, 8对齐,a占用0-3,b占用4,c占用8-87,l占用88-91,一共92个字节。成员中最大的对齐参数是int了92%4=0;
再计算test2, a1z占用0,a2占用1,t1呢,4 % 4 (test1里面最长的成员的对齐方式) = 0, 4-95,b1占96到103;一共104个字节,成员中最大的对齐参数是double了104%8=0; 所以是104.
那关于我文章开头提到的那个文件转换,我现在只要知道原始程序是按照什么对齐的,然后在新程序中指定按照几对齐就可以了,哈哈!
挤时间写的,有的地方有遗漏,请各位指正!