最新结构体对齐为什么那么重要?_c语言结构体位置重要吗,2024年最新初级C C++开发面试题

img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上C C++开发知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

如果你需要这些资料,可以戳这里获取

结构体对齐知识点考察,俨然成为编程技术岗面试笔试的一种标配。我以前找工作被问这种题的时候就经常想,结构体对齐这个东西平常很少用,考这东西干嘛?为什么结构体对齐那么重要。看看这个例子:

    typedef struct     {        int e_int;        char e_char1;        char e_char2;    }S2;
    typedef struct     {        char e_char1;        int e_int;        char e_char2;    }S3;    S2 s2;    S3 s3;

你觉得这俩结构体所占内存是一样大吗?其实不是!

好像也没什么啊,一不一样大对于C语言程序员有什么所谓!

也许你还还感觉不到,上段代码:

    S2 s2[1024] = {0};    S3 s3[1024] = {0};

对于32位系统,s2的大小为8K,而s3的大小为12K,一放大,就有很明显的区别了。

再举个例子:

unsigned char bytes[10]={0};int* p = (int*)&bytes[3];*p = 0x345678;

你觉得执行上面的代码会发生什么情况?Warining?只是Warning么?!以前我也没觉得懂得这个结构体对齐或者内存对齐有多重要,直到已经从事了嵌入式开发经验不断积累,才慢慢体会到,这是一种很基础的知识,就因为这个东西不常用,而出现相关的问题是非常致命的,排查起来成本非常高。有个小伙伴,因为一个内存对齐(结构体对齐相关知识点)问题导致的偶发性Exception问题,折腾了一个多星期。由于项目接近尾声,出现这种问题,项目经理、老板都操心得不得了。天天不是奶茶水果,就是宵夜,把小伙伴当宝贝来哄,为的就是快速定位这个问题。然而,他们日以继夜的排查了一个多星期,依然一脸懵逼。直到让我参与进来支援,我通过仿真方式碰巧捕捉到了这种异常情况。问题的根本原因就是强制类型转换导致的内存对齐问题。篇幅有限,这个故事,以后慢慢细讲。接下来先看看,结构体对齐的知识点。结构体对齐,说不难吧,我研究了很多次,都没完全记住;说难吧,理解其原因本质,就易如破竹。**结构体对齐,其实其本质就是内存对齐。**什么以最大元素变量为单位,什么最小公倍数等等法则,通通都是让你死记硬背的,没两天就忘了。为什么要结构体对齐,原因就是内存要对齐,原因是芯片内存的制造限制,是制造成本约束,是内存读取效率要求。如果你上学的时候认真学习过微机原理,应该还记得,芯片的地址总线和数据总线这个概念吧。没学过微机原理也没关系,8位单片机、16位单片机和32位单片机等等,这些总得听说过吧。

这个8位、16位和32位等,指的是单片机一次处理数据的宽度,也就和数据总线相关了。
细心的小伙伴会知道,16位单片机的通用寄存器例如R0的长度是2个字节的,而32位的是4字节的。也就是说16位单片机,单指令一次访问数据是2个字节,而32位单片机可以访问4字节。为了提高MCU的运行效率,内存设计上,进来适应这个CPU的总线访问。以32位MCU为例,其内存一般都是每4字节(32位)为一个小单元,有时候也叫1个字(Word)。
注意:字节,这个概念长度是固定的,就是8bit;而,却不是固定的,跟CPU或系统位数有关,有时候还会出现字、双字这些概念,举例说明下:32位计算机:1字=32位=4字节,64位计算机:1字=64位=8字节所以,对于C语言的变量的存放和访问,都会按着这单位来,例如32位系统中,char是一个字节的,就按Byte来,int是4字节的,那么按Word来。
为什么要这样呢?
如果,一块内存在地址上随便放的,CPU有可能就会用到多条指令来访问,这就会降低效率。对于32位系统,如下图的A可能需要2条指令访问,而B只需1条指令。

不仅单片机这样,我们常用的计算机也是这样,你看内存条,长这样的:

你以为,通过总线的方式可以随便访问一个地址吗?

但是,为了提高访问速度,其设计是这样的:

这样,这个地址就必须是8的倍数。
如果你要从不对齐的内存读取数据,虽然在C语言编程上感觉不到这样的操作有什么区别,但CPU是分开多次读出来的。这就是内存对齐了。int8(即char)是以1字节对齐,int16是以2字节对齐,而int32是以4字节对齐的,等等。世界上CPU平台、系统那么多,我们怎么知道哪个类型到底有多长,是以哪种长度对齐的?

不要瞎猜,直接上代码。每个平台都不一样,请读者自行测试,以下我是基于Windows上MinGW的GCC测的。

#define BASE_TYPE_SIZE(t)   printf("%12s : %2d Byte%s\n", #t, sizeof(t), (sizeof(t))>1?"s":"")void base_type_size(void){    BASE_TYPE_SIZE(void);    BASE_TYPE_SIZE(char);    BASE_TYPE_SIZE(short);    BASE_TYPE_SIZE(int);    BASE_TYPE_SIZE(long);    BASE_TYPE_SIZE(long long);    BASE_TYPE_SIZE(float);    BASE_TYPE_SIZE(double);    BASE_TYPE_SIZE(long double);    BASE_TYPE_SIZE(void*);    BASE_TYPE_SIZE(char*);    BASE_TYPE_SIZE(int*);        typedef struct     {    }StructNull;    BASE_TYPE_SIZE(StructNull);    BASE_TYPE_SIZE(StructNull*);}

结果是:

        void :  1 Byte        char :  1 Byte       short :  2 Bytes         int :  4 Bytes        long :  4 Bytes   long long :  8 Bytes       float :  4 Bytes      double :  8 Bytes long double : 12 Bytes       void* :  4 Bytes       char* :  4 Bytes        int* :  4 Bytes  StructNull :  0 Byte StructNull* :  4 Bytes

这些内容不用记住,不同平台是不一样的,使用之前,一定要亲自测试验证下。

这里先解释下“模数”的概念:

每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。

接着看网上流传一个表:

本文的的例子我用的是MinGW32的GCC来测试,你猜符合上表的哪一项?

别急,再看一个例子:

    typedef struct     {        int e_int;        double e_double;    }S11;    S11 s11;    STRUCT_E_ADDR_OFFSET(s11, e_int);    STRUCT_E_ADDR_OFFSET(s11, e_double);

结果是:

  s11 size = 16        s11.e_int addr: 0028FF18, offset:  0  s11 size = 16     s11.e_double addr: 0028FF20, offset:  8

很明显,上表没有一项完全对应得上的。简单汇总以下我测试的结果:

**所以再强调一下:因为环境的差异,**在你参考使用之前,请自行测试一下。

其实,这个模数是可以改变的,可以用预编译命令**#pragma pack(n)**,n=1,2,4,8,16来改变这一系数,其中的n就是你要指定的“对齐系数”。

例如:

#pragma pack(1)typedef struct {    char e_char;    long double e_ld;}S14;#pragma pack()

想知道结构图元素内存如何对齐,其实非常简单。
其实,你只需知道当前你使用的这个系统的基本类型的sizeof是多少,然后根据这个大小做对齐排布。例如,本文一开始的例子:

    typedef struct     {        int e_int;        char e_char1;        char e_char2;    }S2;
    typedef struct     {        char e_char1;        int e_int;        char e_char2;    }S3;    S2 s2;    S3 s3;

32位系统中,它们内存是这么对齐的:

简单解释下:

S2中的元素e_int是按4字节对齐的,其地址位4整数倍,而e_char1和e_char2就按1字节对齐,紧跟其后面就可以了;

而S3中的元素e_char1是按1字节对齐的,放在最前面,而e_int是按4字节对齐的,其地址位4整数倍,所以,只能找到个+4的位置,紧接着e_char2就按1字节对齐,跟其后面就可以了。

img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上C C++开发知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

如果你需要这些资料,可以戳这里获取

阶课程,涵盖了95%以上C C++开发知识点,真正体系化!**

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

如果你需要这些资料,可以戳这里获取

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值