关于结构体内存对齐总结

内存对齐计算可谓是笔试题的必考题,但是如何按照计算原则算出正确答案一开始也不是很容易的事,所以专门通过例子来复习下关于结构体内存对齐的计算问题。(编译环境为vs2015)
对齐原则:
原则1:数据成员对齐规则:结构(struct)(或联合(union))的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员的对齐按照#pragma pack指定的数值和这个数据成员自身长度中,比较小的那个进行。
原则2:结构(或联合)的整体对齐规则:在数据成员完成各自对齐之后,结构(或联合)本身也要进行对齐,对齐将按照#pragma pack指定的数值和结构(或联合)最大数据成员长度中,比较小的那个进行。
原则3:结构体作为成员:如果一个结构里有某些结构体成员,则结构体成员要从其内部最大元素大小的整数倍地址开始存储。

默认对齐值:
Linux 默认#pragma pack(4)
window 默认#pragma pack(8)
注:可以通过预编译命令#pragma pack(n),n=1,2,4,8,16来改变这一系数,其中的n就是指定的“对齐系数”。

例一:一字节对齐
第一步: 成员数据对齐
#pragma pack(1)
struct AA {
    int a;   //长度4 > 1 按1对齐;偏移量为0;存放位置区间[0,3]
    char b;  //长度1 = 1 按1对齐;偏移量为4;存放位置区间[4]
    short c; //长度2 > 1 按1对齐;偏移量为5;存放位置区间[5,6]
    char d;  //长度1 = 1 按1对齐;偏移量为6;存放位置区间[7]
    //整体存放在[0~7]位置区间中,共八个字节。
};
#pragma pack()
第二步: 整体对齐
整体对齐系数 = min((max(int,short,char), 1) = 1,所以不需要再进行整体对齐。整体大小就为8。
图示如下:

这里写图片描述


例二:二字节对齐
第一步: 成员数据对齐
#pragma pack(2)
struct AA {
    int a;   //长度4 > 2 按2对齐;偏移量为0;存放位置区间[0,3]
    char b;  //长度1 < 2 按1对齐;偏移量为4;存放位置区间[4]
    short c; //长度2 = 2 按2对齐;偏移量要提升到2的倍数6;存放位置区间[6,7]
    char d;  //长度1 < 2 按1对齐;偏移量为7;存放位置区间[8];共九个字节
};
#pragma pack()
第二步: 整体对齐
整体对齐系数 = min((max(int,short,char), 2) = 2,将9提升到2的倍数,则为10.所以最终结果为10个字节。
图示如下:(X为补齐部分)

这里写图片描述


例三:四字节对齐
第一步: 成员数据对齐
#pragma pack(4)
struct AA {
    int a;   //长度4 = 4 按4对齐;偏移量为0;存放位置区间[0,3]
    char b;  //长度1 < 4 按1对齐;偏移量为4;存放位置区间[4]
    short c; //长度2 < 4 按2对齐;偏移量要提升到2的倍数6;存放位置区间[6,7]
    char d;  //长度1 < 4 按1对齐;偏移量为7;存放位置区间[8];总大小为9
};
#pragma pack()
第二步: 整体对齐
整体对齐系数 = min((max(int,short,char), 4) = 4,将9提升到4的倍数,则为12.所以最终结果为12个字节。
图示如下:(X为补齐部分)

这里写图片描述


例三:八字节对齐
第一步: 成员数据对齐
#pragma pack(8)
struct AA {
    int a;   //长度4 < 8 按4对齐;偏移量为0;存放位置区间[0,3]
    char b;  //长度1 < 8 按1对齐;偏移量为4;存放位置区间[4]
    short c; //长度2 < 8 按2对齐;偏移量要提升到2的倍数6;存放位置区间[6,7]
    char d;  //长度1 < 8 按1对齐;偏移量为7;存放位置区间[8],总大小为9
};
#pragma pack()
第二步: 整体对齐
整体对齐系数 = min((max(int,short,char), 8) = 4,将9提升到4的倍数,则为12.所以最终结果为12个字节。图示如上。
注:可以通过stddef.h库中的offsetof宏来查看对应结构体元素的偏移量。

例四:结构体中包含结构体的运算
整体计算过程如下
struct EE
{
    int a;      //长度4 < 8 按4对齐;偏移量为0;存放位置区间[0,3]
    char b;     //长度1 < 8 按1对齐;偏移量为4;存放位置区间[4]
    short c;    //长度2 < 8 按2对齐;偏移量由5提升到6;存放位置区间[6,7]
    //结构体内部最大元素为int,由于偏移量为8刚好是4的整数倍,所以从8开始存放接下来的struct FF
    struct FF
    {
        int a1;     //长度4 < 8 按4对齐;偏移量为8;存放位置区间[8,11]
        char b1;    //长度1 < 8 按1对齐;偏移量为12;存放位置区间[12]
        short c1;   //长度2 < 8 按2对齐;偏移量为13,提升到2的倍数14;存放位置区间[14,15]
        char d1;    //长度1 < 8 按1对齐;偏移量为16;存放位置区间[16]
    };
    //整体对齐系数 = min((max(int,short,char), 8) = 4,将内存大小由17补齐到4的整数倍20
    char d;         //长度1 < 8 按1对齐;偏移量为21;存放位置区间[21]
    //整体对齐系数 = min((max(int,short,char), 8) = 4,将内存大小由21补齐到4的整数倍24
};

图示如下:

这里写图片描述

例五:再来一个嵌套结构体的计算

整体计算过程如下
struct B {
    char e[2];      //长度1 < 8 按2对齐;偏移量为0;存放位置区间[0,1]
    short h;        //长度2 < 8 按2对齐;偏移量为2;存放位置区间[2,3]
    //结构体内部最大元素为double,偏移量为4,提升到8,所以从8开始存放接下来的struct A
    struct A {
        int a;      //长度4 < 8 按4对齐;偏移量为8;存放位置区间[8,11]
        double b;   //长度8 = 8 按8对齐;偏移量为12,提升到16;存放位置区间16,23]
        float c;    //长度4 < 8,按4对齐;偏移量为24,存放位置区间[24,27]
    };
    //整体对齐系数 = min((max(int,double,float), 8) = 8,将内存大小由28补齐到8的整数倍32
};

图示如下:

这里写图片描述

小结:当#pragma pack的n值等于或超过所有数据成员长度的时候,这个n值的大小将不产生任何效果。


会了关于结构体内存大小的计算,可是为什么系统要对于结构体数据进行内存对齐呢,很明显所占用的空间大小要更多。原因可归纳如下:
1、平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2、性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

更简单的说明下:如图

这里写图片描述

首先,cpu的访问粒度为4,也就是一次性可以读取内存中的四个字节内容;当我们不采用内存对齐策略,如果需要访问A中的b元素,cpu需要先取出0~3四个字节的内容,发现没有读取完,还需要再次读取,一共需要进行两次访问内存的操作;而有了内存对齐,参考左图,可一次性取出4~7四个字节的元素也即是b,这样就只需要进行一次访问内存的操作。所以操作系统这样做的原因也就是所谓的拿空间换时间,提高效率。

建议:虽然操作系统会浪费空间来完成内存对齐,但是我们有了上面的知识可以通过按照数据类型来调整结构体内部的数据的先后顺序来尽量减少内存的消耗;例如我们将下面结构体A中的顺序调整为B,sizeof(A)的结果为12,而sizeof(B)的结果就是8:
struct A
{
    char a;
    int b;
    char c;
};

struct B
{
    char a;
    char c;
    int b;
};
  • 23
    点赞
  • 91
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
在C语言中,结构体的内对齐是一种优化手段,用于提高内访问效率和减少内浪费。结构体的内对齐规则是根据结构体成员的类型和顺序,以及编译器的对齐方式来确定的。 根据引用中的例子,我们可以看到结构体s1和s2的成员顺序相同,但是它们的内对齐结果却不同。结构体s1的大小为8字节,结构体s2的大小为12字节。这是因为编译器在对齐结构体时,会根据最大成员的大小来确定对齐方式。在结构体s1中,最大成员是int类型的c,大小为4字节,所以结构体s1的对齐方式是4字节对齐。而在结构体s2中,最大成员是char类型的b,大小为1字节,所以结构体s2的对齐方式是1字节对齐。 另外,根据引用的例子,我们可以看到结构体s2中嵌套了结构体s1。通过使用offsetof函数,我们可以得到结构体s2中成员a和成员c的偏移量分别为0和4字节,这表明结构体s2中的成员是按照其在结构体中的声明顺序进行排列的。同时,结构体s2的大小为12字节,这是因为结构体s2的对齐方式是最大成员char类型b的大小1字节。 总结起来,C语言结构体的内对齐是根据结构体成员的类型和顺序,以及编译器的对齐方式来确定的。这种对齐可以提高内访问效率和减少内浪费。不同的结构体可能有不同的对齐方式和大小,这取决于结构体中最大成员的大小和结构体中的成员顺序。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [【C语言系列】-结构体中的内对齐](https://blog.csdn.net/m0_64332179/article/details/122682708)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [【C语言】——结构体进阶:结构体的内对齐(超详细)](https://blog.csdn.net/luoheng1114/article/details/127106154)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值