结构体的声明
结构的基础知识
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
结构的声明
struct tag
{
member-list;
}variable-list;
例如描述一个学生:
struct Stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
};//分号不能丢
特殊的声明
在声明结构的时候,可以不完全的声明
比如:
//匿名结构体类型
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}a[20],*p;
上面的两个结构在声明的时候省略掉了结构体标签(tag)。
那么问题来了?
//上面代码的基础上,下面的代码合法吗?
p = &x;
警告:编译器会把上面的两个声明当成完全不同的两个类型。所以是非法的。
结构体的自引用
先解释一下什么是结构体的自引用。
在数据结构中的链表的概念,链表中的结点既要能够存放数据又能找到下一个结点。
如果这样定义结点
struct Node
{
int data;//4bit
struct Node n;//不知道该给分配多大的内存
}
但是不能这样写,因为结构体类型不能包含自己。
正确的做法是一个结点里可以包括下一个结点的地址。
struct Node
{
int data;//4bit
struct Node* next;//4bit
};
关于结构体typedef
不能像下面这样写
typedef struct
{
int data;
Node* next;
}Node;
不能在没有定义Node这个类型名就使用,下面的是正确的。
typedef struct Node
{
int data;
struct Node* next;
}Node;
结构体变量的定义和初始化
有了结构体类型,那如何定义变量,其实很简单。
struct Point
{
int x;
int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
//初始化:定义变量的同时赋初值
struct Point p3 = {x, y}
struct Stu //类型声明
{
char name[15];//名字
int age; //年龄
};
struct Stu s = {"zhangsan", 20};//初始化
struct Node
{
int data;
struct Point p;
struct Node* next;
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5,6}, NULL};//结构体嵌套初始化
结构体内存对齐
struct S1
{
char c1;
int a;
char c2;
};
struct S2
{
char c1;
char c2;
int a;
};
int main()
{
struct S1 s1 = {0};
printf("%d\n", sizeof(s1));
struct S2 s2 = {0};
printf("%d\n", sizeof(s2));
return 0;
}
运行结果
如何计算?首先得掌握结构体的对齐规则:
- 第一个成员在与结构体变量偏移量为0的地址处。
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
- 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
- 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
对齐数=编译器默认的一个对齐数与该成员大小的较小值。
VS中默认的值为8
假设从橙色箭头开始存放,第一个成员在与结构体变量偏移量为0的地址处,我们把c1存放在偏移量0的位置。
第二个成员要对齐在对齐数的整数倍的地址处。int型是4个字节,编译器默认对齐数是8,较小值是4,4的整数倍的地址处是4,所以a要存储在偏移量4的位置。
第三个成员也要对齐在对齐数的整数倍的地址处。char型是1个字节,编译器默认对齐数是8,较小值是1,1的整数倍的地址处是8,所以c2要存储在偏移量8的位置。
结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。最大对齐数是4,所以最合适的三倍,也就是12字节。
S2以此类推
假设从橙色箭头开始存放,第一个成员在与结构体变量偏移量为0的地址处,我们把c1存放在偏移量0的位置。
第二个成员要对齐在对齐数的整数倍的地址处。char型是1个字节,编译器默认对齐数是8,较小值是1,所以a要存储在偏移量2的位置。
第三个成员也要对齐在对齐数的整数倍的地址处。int型是4个字节,编译器默认对齐数是8,较小值是4,所以c2要存储在偏移量4的位置。
结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。最大对齐数是4,所以最合适的两倍,也就是8字节。
struct S3
{
double d;
char c;
int i;
};
struct S4
{
char c1;
struct s3 s3;
double d;
};
int main()
{
struct S3 s3 = {0};
printf("%d\n", sizeof(s3));
struct S4 s4 = {0};
printf("%d\n", sizeof(s4));
return 0;
}
运行结果
这里说一下 s4的计算过程
第一个成员在与结构体变量偏移量为0的地址处,我们把c1存放在偏移量0的位置。
第二个元素是个结构体,嵌套的结构体对齐到自己的最大对齐数的整数倍处,S3最大对齐数是8,所以对齐到8。s3大小是16。
第三个成员也要对齐在对齐数的整数倍的地址处。double型是8个字节,编译器默认对齐数是8,较小值是8,所以c2要存储在偏移量24的位置。
结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。最大对齐数是8,所以最合适的两倍,也就是32字节。
为什么要存在内存对齐
大部分的参考资料都是如是说的
- 平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则拋出硬件异常。
- 性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
总体来说:
结构体的内存对齐是拿空间来换取时间的做法。
比如说32位机器上有32根数据线,也就是一次读取数据32bit,换算出来是4个字节。
如果我们想读取结构体中的int a,不内存对齐的从c开始读取要读取两次,然后把a前后拼起来,但使用内存对齐,可以直接从a开头读,只需要读一次。
所以这是一种空间换时间的方法。
那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到;
让占用空间小的成员尽量集中在一起。
struct S1
{
char c1;
int a;
char c2;
};
struct S2
{
char c1;
char c2;
int a;
};
S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别。
修改默认对齐数
#pragma这个预处理指令,可以改变我们的默认对齐数
//设置默认对齐数位1
#pragma pack(1)
struct S
{
char c1; //1
double d;//8
};
#pragma pack()
//取消设置的默认对齐数
int main()
{
struct S s;
printf("%d\n", sizeof(s));
return 0;
}
上述代码中#pragma pack(1)到#pragma pack()之间这个范围的默认对齐数被改为了1。
运行结果
结论:
结构在对齐方式不合适的时候,我们可以自己更改默认对齐数。