【c语言】结构体与结构体的内存对齐

Merrill_hh

已于 2023-03-26 11:25:13 修改

阅读量80

点赞数 3

文章标签： c语言学习经验分享

于 2023-03-26 10:52:34 首次发布

本文链接：https://blog.csdn.net/Merrill_Rosie/article/details/129776374

版权

文章详细阐述了C语言中结构体的声明、匿名结构体、自引用的正确方式，以及结构体变量的定义和初始化。重点讨论了结构体内存对齐的规则，包括编译器的默认对齐策略和如何修改对齐数，强调了内存对齐对于性能和平台兼容性的影响。

摘要由CSDN通过智能技术生成

结构体与结构体的内存对齐

1. 结构体
2. 结构体内存对齐
- 2.1 结构体内存对齐的知识
- 2.2 修改默认对齐数

1. 结构体

结构体就是一些值的集合，这些值称为成员变量。结构体的每个成员可以是不同类型的成员变量。

1.2 结构体的声明

struct tag(标签名，一般用来描述该结构体是做什么的)
{
	member-list;//结构体成员列表
}variable-list;//定义的全局变量名，也可以省略~
			   //但是，切记，分号不能丢！！！

for example
创建一个学生类型的结构体：

struct Student
{
	//学生的相关属性
	char name[20];//姓名
	int age;//年龄
	char gander[5];//性别
	...
} s1,s2;//s1,s2是全局变量,是struct Stu类型的变量
int main()
{
	struct Student s3;//s3是局部变量
	return 0;
}

1.3 结构体的特殊声明

在上面，我们介绍了结构体的声明，一个结构体是需要标签名，那么可不可以省略呢？
答案是可以的。
这就是结构体的不完全声明。没有了标签名，也就成了匿名结构体。
但是，这些匿名结构体只能使用一次。
for example
我们可以将结构体这样定义~

struct
{
    int a;
    char b;
    float c;
}s1;
struct
{
    int a;
    char b;
    float c;
}*ps2;

这就是匿名结构体，它们都省略了标签名tag
在上面代码的基础上，下面的代码河里吗？

int main()
{
	ps2 = &s1;
	//编译会报错，编译器认为它们是两种不同的类型，但是语法上又是支持这种结构体类型的
	return 0;
}

从上面的两段代码，我们又可以从侧面得出我们在开始所说的结论：

匿名结构体只能使用一次！

1.4 结构体的自引用

在结构中包含一个类型为该结构本身的成员是否可以呢？
先来看这种引用方式：

struct Node
{
	int data;
	struct Node next;
}

这样可行吗，如果觉得可行的话，那我们能否算出来sizeof(struct Node)呢？
经过仔细思考后，发现sizeof(struct Node)的值好像并不能算出来，一环套一环，好像莫比乌斯环一样，永无止境。
所以说这是一种错误的自引用方式。
那么问题又来了，结构体到底该怎么实现自引用呢，还是结构体压根就不能自引用呢？
我相信，接触过数据结构的同学们都知道，链表的实现就需要用到结构体的自引用，因此结构体还是有办法实现它的自引用的。
让我们来看下面一段正确引用方式的代码：

struct Node
{
    int data;//数据域
    struct Node* next;//指针域
};

（这里顺带画一下链表的实现方式，让同学们对结构的自引用加深印象）
此外，还得注意这样的代码方式：

typedef struct
{
    int data;
    Node* next;//Node还未定义就已经使用了
}Node;

这种方式是一种错误代码，语法不支持。
正确的书写方式应该是这样的~

typedef struct Node
{
	int data;
	struct Node* next;
}Node;

1.5 结构体变量的定义和初始化

结构体是自定义类型，有了结构体，我们定义变量就变得容易起来了
看看下段代码，结构体的定义与它的初始化~

struct Point
{
	int x;
	int y;
}p1;
struct score
{
	int n;
	char ch;
};
//结构体的嵌套使用
struct Stu
{
	char name[20];
	int age;
	struct score s;
};
int main()
{
	struct Point p2 = { 3,4 };//结构体的定义（这样是不是有点像整型数组？）
	struct Stu s1 = { "zhangsan", 20 , {100, 'q'}};//结构体的嵌套定义
	printf("%s %d %d %c\n", s1.name, s1.age, s1.s.n, s1.s.ch);
	return 0;
}

2. 结构体内存对齐

2.1 结构体内存对齐的知识

我们已经基本了解了结构体的使用规则了，那么如何计算结构体的所占的内存空间大小呢？
比如：

struct S1
{
	char c1;
	int i;
	char c2;
};

一眼看过去1+4+1=6，所占内存大小6个字节，感觉好像没什么大毛病。
但是，实际呢？让我们打开VS运行一下便知。
请添加图片描述

结果还好像有那么一点点出人意料。
这里我们就需要了解一下结构体内存对齐的知识了！

结构体的对齐规则：

第一个成员永远放在结构体变量偏移量为0的地址处。
其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。
如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

我们再来看上段代码

struct S1
{
	char c1;
	int i;//4比8小，i对齐4的倍数的位置
	char c2;//1比8小，c2对齐1的倍数的位置
	//整体大小，为最大对齐数4的整数倍也就是12
};

根据内存对齐的规则，我们可以对这个结构体画出一个大概的分布：
请添加图片描述
这里我们用的VS编译器，在VS编译器中，它的默认对齐数时8，而在gcc下，没有默认对齐数。
相信到这里，我们应该了解了C语言结构体的内存对齐了吧。
为什么存在内存对齐呢？

大部分的参考资料都是如是说的：
1. 平台原因(移植原因)：
不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
2. 性能原因：
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。
就拿上段代码举例吧！
如果没有对齐，在32位机器下，一次访问32个比特位也就是4个字节（图片些许草率QAQ，见谅！）

那么中间这个int i变量，我们需要两次才能访问完全，如果存在对齐的话，仅需要一次访问。

总的来说就是拿结构体的内存对齐是拿空间来换取时间的做法。
那在设计结构体的时候，我们既要满足对齐，又要节省空间，就应该让占用空间小的成员尽量集中在一起。

for example

struct S1
{
    char c1;
    int i;
    char c2;
};
struct S2
{
    char c1;
    char c2;
    int i;
};

S1和S2类型的成员一模一样，但是，S1和S2所占空间的大小有了一些区别。相对来说第二种更为节省空间。

2.2 修改默认对齐数

在某些时候，我们有必要修改默认对齐数
使用#program就可以修改默认对齐数

#pragma pack(8)//设置默认对齐数为8
struct S1
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认
#pragma pack(1)//设置默认对齐数为1

Merrill_hh

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫