结构体与结构体的内存对齐
1. 结构体
结构体就是一些值的集合,这些值称为成员变量。结构体的每个成员可以是不同类型的成员变量。
1.2 结构体的声明
struct tag(标签名,一般用来描述该结构体是做什么的)
{
member-list;//结构体成员列表
}variable-list;//定义的全局变量名,也可以省略~
//但是,切记,分号不能丢!!!
for example
创建一个学生类型的结构体:
struct Student
{
//学生的相关属性
char name[20];//姓名
int age;//年龄
char gander[5];//性别
...
} s1,s2;//s1,s2是全局变量,是struct Stu类型的变量
int main()
{
struct Student s3;//s3是局部变量
return 0;
}
1.3 结构体的特殊声明
在上面,我们介绍了结构体的声明,一个结构体是需要标签名,那么可不可以省略呢?
答案是可以的。
这就是结构体的不完全声明。没有了标签名,也就成了匿名结构体。
但是,这些匿名结构体只能使用一次。
for example
我们可以将结构体这样定义~
struct
{
int a;
char b;
float c;
}s1;
struct
{
int a;
char b;
float c;
}*ps2;
这就是匿名结构体,它们都省略了标签名tag
在上面代码的基础上, 下面的代码河里吗?
int main()
{
ps2 = &s1;
//编译会报错,编译器认为它们是两种不同的类型,但是语法上又是支持这种结构体类型的
return 0;
}
从上面的两段代码,我们又可以从侧面得出我们在开始所说的结论:
匿名结构体只能使用一次!
1.4 结构体的自引用
在结构中包含一个类型为该结构本身的成员是否可以呢?
先来看这种引用方式:
struct Node
{
int data;
struct Node next;
}
这样可行吗,如果觉得可行的话,那我们能否算出来sizeof(struct Node)呢?
经过仔细思考后,发现sizeof(struct Node)的值好像并不能算出来,一环套一环,好像莫比乌斯环一样,永无止境。
所以说这是一种错误的自引用方式。
那么问题又来了,结构体到底该怎么实现自引用呢,还是结构体压根就不能自引用呢?
我相信,接触过数据结构的同学们都知道,链表的实现就需要用到结构体的自引用,因此结构体还是有办法实现它的自引用的。
让我们来看下面一段正确引用方式的代码:
struct Node
{
int data;//数据域
struct Node* next;//指针域
};
(这里顺带画一下链表的实现方式,让同学们对结构的自引用加深印象)
此外,还得注意这样的代码方式:
typedef struct
{
int data;
Node* next;//Node还未定义就已经使用了
}Node;
这种方式是一种错误代码,语法不支持。
正确的书写方式应该是这样的~
typedef struct Node
{
int data;
struct Node* next;
}Node;
1.5 结构体变量的定义和初始化
结构体是自定义类型,有了结构体,我们定义变量就变得容易起来了
看看下段代码,结构体的定义与它的初始化~
struct Point
{
int x;
int y;
}p1;
struct score
{
int n;
char ch;
};
//结构体的嵌套使用
struct Stu
{
char name[20];
int age;
struct score s;
};
int main()
{
struct Point p2 = { 3,4 };//结构体的定义(这样是不是有点像整型数组?)
struct Stu s1 = { "zhangsan", 20 , {100, 'q'}};//结构体的嵌套定义
printf("%s %d %d %c\n", s1.name, s1.age, s1.s.n, s1.s.ch);
return 0;
}
2. 结构体内存对齐
2.1 结构体内存对齐的知识
我们已经基本了解了结构体的使用规则了,那么如何计算结构体的所占的内存空间大小呢?
比如:
struct S1
{
char c1;
int i;
char c2;
};
一眼看过去1+4+1=6,所占内存大小6个字节,感觉好像没什么大毛病。
但是,实际呢?让我们打开VS运行一下便知。
结果还好像有那么一点点出人意料。
这里我们就需要了解一下结构体内存对齐的知识了!
结构体的对齐规则:
- 第一个成员永远放在结构体变量偏移量为0的地址处。
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
- 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
- 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
我们再来看上段代码
struct S1
{
char c1;
int i;//4比8小,i对齐4的倍数的位置
char c2;//1比8小,c2对齐1的倍数的位置
//整体大小,为最大对齐数4的整数倍也就是12
};
根据内存对齐的规则,我们可以对这个结构体画出一个大概的分布:
这里我们用的VS编译器,在VS编译器中,它的默认对齐数时8,而在gcc下,没有默认对齐数。
相信到这里,我们应该了解了C语言结构体的内存对齐了吧。
为什么存在内存对齐呢?
大部分的参考资料都是如是说的:
1. 平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2. 性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
就拿上段代码举例吧!
如果没有对齐,在32位机器下,一次访问32个比特位也就是4个字节(图片些许草率QAQ,见谅!)
那么中间这个int i变量,我们需要两次才能访问完全,如果存在对齐的话,仅需要一次访问。
总的来说就是拿结构体的内存对齐是拿空间来换取时间的做法。
那在设计结构体的时候,我们既要满足对齐,又要节省空间,就应该让占用空间小的成员尽量集中在一起。
for example
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
char c2;
int i;
};
S1和S2类型的成员一模一样,但是,S1和S2所占空间的大小有了一些区别。相对来说第二种更为节省空间。
2.2 修改默认对齐数
在某些时候,我们有必要修改默认对齐数
使用#program就可以修改默认对齐数
#pragma pack(8)//设置默认对齐数为8
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为1