面试必考：内存对齐(字节对齐)、位段(位域)的计算，以及枚举类型、联合体

最新推荐文章于 2024-03-05 22:41:48 发布

It‘s so simple

最新推荐文章于 2024-03-05 22:41:48 发布

阅读量459

点赞数 2

分类专栏： C

本文链接：https://blog.csdn.net/weixin_43937101/article/details/112814370

版权

C 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

本文深入探讨了结构体在内存中的布局规则，包括内存对齐的重要性、如何计算结构体大小以及内存浪费的原因。通过实例分析了不同结构体成员排列对大小的影响，强调了内存对齐对于平台移植和性能提升的意义。同时介绍了位段、枚举和联合等概念，以及如何利用联合体判断系统大小端。文章还提供了内存对齐和结构体设计的优化建议。

摘要由CSDN通过智能技术生成

结构体

结构体的声明与定义

结构是一些值得集合，这些值称为成员变量。结构的每个成员可以是不同类型的变量

声明1

struct Student
{
	char name[30];
	int age;
}s1,s2;

这里只是对结构体Student进行了声明，并没有开辟空间来存放它。代码中的s1,s2是 struct Student类型的全局变量，可以在main函数中直接调用。

定义1

struct Student s;

这是对结构体Student的定义，表明已经给它实际分配了内存的空间

声明2

typedef struct Teacher
{
	char name[30];
	int age;
}T;

这里的T是 typedef(重定义) 出来的，相当于将 struct Teacher 重定义为 typedef struct Teacher T。在定义结构体时可直接使用它。

定义2

T s = { "English" , 18 };

直接用T即可定义该结构体，结构体的初始化是使用一对花括号({ })进行的。
结构体定义的是变量的集合，严格来说是定义出这些变量的类型

结构体内存对齐(重点)

结构体内存对齐的规则

第一个成员在与结构体变量偏移量为0的地址处。
其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数与该成员大小的最小值。
VS中默认的值为8
结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。
如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

内存对齐的练习

练习1

struct S1
{
 char c1;
 int i;
 char c2;
};

根据规则进行分析：

首先c1的处于结构体地址为0的地方，占1个Byte(规则1)
接下来的 i 应该在地址为4的地方，并且在c1 和 i 之间补3Byte(规则2)
c2紧挨着 i (地址为8)的地方，占1个Byte
整体的大小，由于前面只占了9个Byte，不满足规则3，因此需要再补3个Byte，变为12Byte，即可满足规则3
结构体s1的大小为12Byte

过程如图所示：

练习2

struct S1
{
 char c1;
 char c2;
 int i;
};

分析：

c1处于地址为0的地方，占1个Byte
c2紧挨着c1，占1个Byte
i 的对齐数为4，因此需要加2个Byte到地址为4的地方，i 占4个Byte
总计8Byte，满足规则3，因此结构体s1的大小为8Byte

练习3

struct S2
{
 double d;
 char c;
 int i;
};

分析：

d处于地址为0的地方，占8个Byte
c的对齐数为1，因此c紧挨着d，占1个Byte
i 的对齐数为4，因此需要在原有的字节(9Byte)，再加上3个Byte，达到12Byte，再存放 i ，i占4个Byte
总计16Byte，并且满足规则3，因此结构体s2的大小为16Byte

如图所示：

练习4

struct S3
{
 char c1;
 struct S2 s2;//结构体嵌套
 double d;
};

分析：

c1处于地址为0的地方，占1个Byte
由练习3可知，结构体s2的最大对齐数为8，因此需要补上7个Byte，在地址为8的地方，存放s2，占16个Byte(规则4)
前面总计占用24Byte，满足规则2，因此d紧挨着放置即可，占8个Byte
4.该结构体的最大对齐数为8，总共有32Byte，满足规则3，因此结构体s3的大小为32Byte

如图所示：

从练习中，我们可以清晰的发现内存对齐的问题是：浪费了空间，它的本质是以空间来换取时间的做法

内存对齐存在的原因

平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
性能原因：数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。

举个例子：

假设在32位的系统下，计算机有32根数据线，一次向内存可以读4Byte，那么每次读内存的时候都是从4Byte的整数倍开始读的。
假设现在该系统要读一个结构体s的内存，s的声明如下：

struct s
{
char c;
int i;
};

当内存对齐时读 i ，如图：

当内存不对齐时读 i ，如图：

因此，要对结构体的内存进行对齐，虽说浪费了空间，但是提高了系统的效率。
那么在设计结构体的时候，我们既要满足对齐，又要节省空间，可以让占用空间小的成员尽量集中在一起，如练习1和练习2一样，练习1的大小为12Byte，练习2的大小为8Byte，同样的成员变量，不同的排序会造成不同的大小。

修改默认对齐数

#pragma pack(2) //将默认的对齐数设置为2
#pragma pack()//取消设置的的默认对齐数，并还原为默认的

结构在对齐方式不合适的时候，我们可以自己更改默认对齐数。

位段

位段的声明和结构体是类似的，但有两点不同：

位段的成员必须是 int、unsigned int 或signed int 。
位段的成员名后边有一个冒号和一个数字。

举个例子：

struct S
{
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};

冒号后的数字代表着该变量只占多少位(bit)。如a就只占3bit;并且位段的成员只能是整型。

位段的内存分配

位段的成员可以是 int unsigned int signed int 或者是 char （属于整形家族）类型
位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。
位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

位段S的大小计算：(1Byte = 8bit)

如果按结构体来计算，那么它的大小应该为4Byte，但是对于位段来说就不是这样了。
首先a占了3bit，b占了4bit，那么a和b就可以放在1个Byte中
c占了5bit，d占了4bit，他们不能组合在一起，因此，他们放在两个不同的Byte中
因此，位段S的大小为3Byte。

struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;

求abcd在内存中是如何分配的。
如图所示：

跟结构体相比，位段可以达到同样的效果，但是可以很好的节省空间，但是有跨平台的问题存在。

枚举

枚举就是枚举常量的列举类型，简单来说就是把可能的取值一一列举出来
举个例子：

enum Day
{
 Mon,
 Tues,
 Wed,
 Thur,
 Fri,
 Sat,
 Sun
};

其中，Day就是一个枚举类型。Day中的内容就是它的可能取值，也叫枚举常量。并且它是默认从0开始递增的。

联合

联合也是一种特殊的自定义类型这种类型定义的变量也包含一系列的成员，特征是这些成员公用同一块空间（所以联合也叫共用体），联合的成员是共用同一块内存空间的，这样一个联合变量的大小，至少是最大成员的大小（因为联合至少得有能力保存最大的那个成员）。
举个例子：

union A
{
	int i;
	char ch;
};
union A aa;
aa.i = 0x11223344;
aa.ch = 0x00

在运行之后，ch的地址是0x00332211(小端机)，这就体现了内存的共用，为 i 赋值后，对ch的修改就是在 i 的地址上修改。

练习

设计一个函数，判断当前计算机的大小端存储，大端返回1，小端返回0，用联合体的特性来表示。

分析：

利用联合体共用内存的性质，对第一个变量进行赋值，然后判断第二个变量的大小，根据大小来分辨大小端机。

代码如下：

union Data
{
	int i;
	char ch;
};

int isBigSystem() {
	union Data d;
	d.i = 1;//0x00000001  //自己规定的左高右低
	if (d.ch == 1) { // 01 00 00 00 小端机  vs中规定左低右高
		return 0;
	}
	else
	{ // 00 00 00 01 大端机
		return 1;
	}
}