【Struct(结构体)杂谈之四】以空间换时间,Struct(结构体)中的成员对齐之道(上)

Struct(结构体)中的成员对齐之道(上)


请先看一道面试题:

问题: 阅读下面一段代码并回答题目之后的问题:

struct ALIGN
{
	int mA;
	int mB;
};


请问在32位系统下 sizeof(ALIGN)的结果是多少?

当然这道题目是难不到广大程序员同学们滴!
在32位机器上int类型占4个字节,structALIGN里面有2个int型变量,那么总共就是8个字节喽!
Bingo,在这个例子中,sizeof(ALIGN)的结果的确是8.




下面,我们把代码修改一下:
#include <iostream>

using namespace std;

struct ALIGN
{
	int mA;
	int mB;
};

struct ALIGN1
{
	int mA;
	short mB;
};


int main()
{
	cout<<sizeof(short)<<endl;
	cout<<sizeof(ALIGN1)<<endl;

	getchar();
	return 0;
}
请问输出是多少?

这还不简单,小case嘛!
mA占4个字节,mB占2个字节,所以Struct ALGN1应该是4+2=6个字节,所以答案是2和6。

---你确定么? (小丫的语言)
----我确定!

好的,请看大屏幕:



咦?结构体的大小不是将结构体元素单纯相加就可以的吗?怎么结果却变成8了呢?

要回答这个问题,需要从计算机的地址对齐讲起。至于为什么需要对齐,当然是对齐能够带来很多好处的。

第一,可以大大简化处理器和存储器之间接口的硬件设计;
第二,提高处理器访问数据的效率。

首先讲下,对齐(alignment)就是计算机系统对基本数据类型的可允许地址做了限制,某种类型的对象的地址必须是某个值k的倍数。

以IA32为例,在自然对齐方式下,基本数据类型(如short,int,double)变量的地址必须被他们的大小整除。
通俗的说,对于int类型的变量,因为宽度为4,因此存放int类型变量的起始地址必须能被4整除,宽度为2的基本数据类型(short等)则位于能被2整除的地址上,以此类推对于char和bool类型的变量,由于其只占用一个字节,则没有特别要求。

我们修改下程序,让其输出成员变量的地址:
#include <iostream>

using namespace std;

struct ALIGN
{
	int mA;
	int mB;
};

struct ALIGN1
{
	int mA;
	short mB;
};


int main()
{
	ALIGN aln0;
	ALIGN1 aln1;

	cout<<"\n"<<&aln0.mA<<"\t"<<&aln0.mB<<endl;
	cout<<"\n"<<&aln1.mA<<"\t"<<&aln1.mB<<endl;

	getchar();
	return 0;
}
程序调试我们可以看到:


从上述结果中,可以看出在struct ALIGN1中,int mA的起始地址为0x0012ff4c可以被4整除,short mB的起始地址为0x0012ff50可以被2整除。

再看下列代码:
#include <iostream>

using namespace std;

struct ALIGN
{
	int mA;
	int mB;
};

struct ALIGN1
{
	int mA;
	short mB;
};

struct ALIGN2
{
	char mA;
	int mB;
	short mC;
};

struct ALIGN3
{
	int mB;
	char mA;
	short mC;
};


int main(void)
{
	ALIGN aln0;
	ALIGN1 aln1;
	ALIGN2 aln2;
	ALIGN3 aln3;

	cout<<"The size of struct ALIGN is:"<<sizeof(ALIGN)<<endl;
	cout<<"\t"<<&aln0.mA<<"\t"<<&aln0.mB<<endl;

	cout<<"The size of struct ALIGN1 is:"<<sizeof(ALIGN1)<<endl;
	cout<<"\t"<<&aln1.mA<<"\t"<<&aln1.mB<<endl;

	cout<<"The size of struct ALIGN2 is:"<<sizeof(ALIGN2)<<endl;
	cout<<"\t"<<&aln2.mA<<"\t"<<&aln2.mB<<"\t"<<&aln2.mC<<endl;

	cout<<"The size of struct ALIGN3 is:"<<sizeof(ALIGN3)<<endl;
	cout<<"\t"<<&aln3.mA<<"\t"<<&aln3.mB<<"\t"<<&aln3.mC<<endl;

	getchar();
	return 0;
}

输出结果如下:


是不是觉得很奇怪?
ALIGN2 和 ALIGN3都是1个int型,1个char型,1个short型,可是它们所占的空间却1个是8,一个是12?
这非常非常不科学啊!

2个结构体都拥有一样的成员变量,可是所占的大小却有很大的区别。这一切的一切,是计算机中的幽灵在作祟,还是另有隐情? 编译器如此厚此薄彼,到底是为什么?被偷去的内存,到底去了哪里?

下一篇我们将使用gcc编译,分析编译生成的每一步,了解编译器具体是怎么做的,为什么需要这么做,为你揭开这些谜团!!!

不要走开,后续更精彩,请关注本人博客后续更新 :-)

©️2020 CSDN 皮肤主题: 大白 设计师: CSDN官方博客 返回首页
实付0元
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值