c++面试问答:内存对齐

内存对齐是一种优化手段,确保数据首地址符合CPU访问效率。硬件因素如CPU单次获取数据大小和可移植性需求是内存对齐的主要原因。对齐规则包括成员对齐和整体对齐,可以通过#pragmapack(n)手动设置对齐值或依赖编译器默认策略。手动设置时,编译器会选择最小的对齐值和最大成员类型字节数的较小者。结构体大小会根据对齐规则进行填充调整。
摘要由CSDN通过智能技术生成

问题

为什么要进行内存对齐?如何对齐?这个问题其实困扰我很久了,之前做过一些笔试题,经常在sizeof()的问题上出错,但一直没有充分地去理解过,所以这次想好好梳理一下。

什么是内存对齐?

所谓的内存对齐,就是为了让内存存取更加有效率而采取的一种优化手段,对齐的结果是使得内存中数据的首地址是CPU单次获取数据大小的整数倍

比如,CPU单次获取数据的大小是4个字节,对于 int x 而言,如果 x 的地址是0x00000000、0x00000004...等4的倍数,就是内存对齐。

此外,这里说的内存对齐,一般就是针对结构体来进行探讨的,所以这就可以理解在本文后面提到的对整体和成员有不同的对齐方式了。

为什么要内存对齐?

1.硬件因素

经过内存对齐之后,CPU对内存访问的效率会大大提高。

举个例子:

● 对于int变量 x 占用4个字节的内存大小,假设它存放在 $ 0x00000003\sim0x00000006$ 的位置上,此时 $0x00000003$ 不是4的整数倍。因此,对于每次只取4个字节的CPU而言,对 x 的读取就必须分两次进行,第一次读取 $ 0x00000000\sim0x00000003$,第二次读取 $ 0x00000004\sim0x00000007$,然后再进行拼接处理,才能得到我们想要的数据,可见这样的效率会很低下。
● 倘若经过对齐,即数据的首地址是CPU单次获取数据大小的整数倍,假设 x 存放在 $ 0x00000004\sim0x00000007$ 的位置,那么CPU只需要访问一次内存就可以读取出 x 的值了。
2.可移植性

不是所有的硬件平台都能访问任意地址上的任意数据的,例如有些平台上CPU在内存非对齐的情况下执行二进制代码会崩溃。为了代码的可移植性,进行内存对齐是很有必要的。

如何进行内存对齐?

对齐方式

方式一: 编译器提供了一种手动指定对齐值的方式,只要在代码前添加关键字 #pragma pack(n) 即可,其中 n 是手动指定的内存对齐的字节数。比如 #pragma pack(4)表示以4个字节进行对齐。

方式二: 倘若没有手动设置对齐值,或者手动设置的对齐值 n 大于成员变量中最大的类型的字节数(注意这一点!),编译器则会默认将成员变量中最大的类型的字节数设置为对齐值(假设为 m)

对齐规则

● 成员对齐: ① 第一个成员的首地址为0

② 假设某**成员的类型所占字节数为 k**,则该成员的首地址为 min(n,k) 的整数倍

● 整体对齐: 结构体总的大小,应该为 min(n,m) 的整数倍,如果不够就在后面填补占位。

补充:如果不能理解上面说的 min(n,k)和 min(n,m),可以看下面的解释:
● 对于min(n,k) 的理解:若手动设置了对齐值 n,且 n<=k,那么首地址就是 n 的倍数,也就是上面的对齐方式一;若 k<n,根据对齐方式二可知,编译器不会将 n 作为对齐值,而是会 选择成员中最大类型的字节数(即 m)作为对齐值 ,由于 m>=k,则该值必然也是 k 的整数倍,因此 min(n,k) 就可以理解啦。
● 对于min(n,m) 的理解:根据对齐方式一和二,其实系统的对齐值就是n和m中最小的那个。当然,整体对齐的意思是整个结构体的总大小要对齐,不够就填补占位。比如,假设对齐值为8,结构体各个成员对齐之后的大小为12,由于12不是8的整数倍,所以编译器会继续填补4个空位,最终结构体的总大小为16。

代码解释

对于方式一,手动设置对齐值 #pragma pack(n),且n不大于成员变量的最大类型,此时编译器的对齐值就是 n。

#include<iostream>
#pragma pack(4)							//对齐值为4
using namespace std;
struct MyStruct
{
	char c;
	double b;
	int a;
};

int main() {
	MyStruct data;
    cout << sizeof(data.a) << endl;		//结果为4
	cout << sizeof(data.b) << endl;		//结果为8
	cout << sizeof(data.c) << endl;		//结果为1,自动填充3个字节
	cout << sizeof(data) << endl;		//结果为16,如果对齐值设置为8,这里结果就是24
	//system("pause");
	return 0;
}

对于方式二,先看不进行手动设置对齐值的情况,编译器默认将成员中最大类型的字节数作为对齐值,即double的类型大小,为 8,具体看代码:

#include<iostream>
using namespace std;
struct MyStruct
{
	char c;
	double b;
	int a;
};

int main() {
	MyStruct data;						//没有手动设置对齐值,编译器默认为最大类型字节数,即8
    cout << sizeof(data.a) << endl;		//结果为4,自动填充4个字节
	cout << sizeof(data.b) << endl;		//结果为8
	cout << sizeof(data.c) << endl;		//结果为1,自动填充7个字节
	cout << sizeof(data) << endl;		//结果为24
	//system("pause");
	return 0;
}

对于方式二,手动设置对齐值n,且n大于成员变量中的最大类型的字节数m,则编译器采用m作为对齐值。

#include<iostream>
#pragma pack(16)						//设置对齐值为16,实际对齐值为sizeof(double)=8
using namespace std;
struct MyStruct
{
	int a;
	double b;
	char c;
};

int main() {
	MyStruct data;
	cout << sizeof(data.a) << endl;		//结果为4,自动填充4个字节
	cout << sizeof(data.b) << endl;		//结果为8
	cout << sizeof(data.c) << endl;		//结果为1,自动填充7个字节
	cout << sizeof(data) << endl;		//结果为24
	//system("pause");
	return 0;
}

总结

用两句话来总结一下内存的对齐方式:

① 若没有手动设置对齐值,则编译器 默认使用成员变量中最大的类型的字节数作为对齐值 ;

② 若手动设置了对齐值,则编译器会 在默认对齐值和手动设置的对齐值之间选择最小的那个作为最终对齐值 。

内存大小的计算

  1. 对于一个空类,sizeof是1

标准规定对象大小不能为0,因为两个对象需要不同的地址,如果为0他们地址就一样了。所以空类会自动创建一个空节点。大小为1。

如果不是空类,那么也就不用考虑这个为1的空节点,直接按照下面的算就可以了。

  1. 对于没有虚函数的类,sizeof就是成员变量的总内存大小

  1. 如果有虚函数,那么就会存在一个this指针,此时sizeof就是成员变量总内存的大小+this指针的大小

  1. 如果成员变量为static修饰,那么这个变量的大小就不会算到类的大小中了

可以理解为static修饰以后变成了全局变量,和这个类无关了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

coder ᅟᅠ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值