本章重点
结构体
- 结构体类型的声明
- 结构的自引用
- 结构体变量的定义和初始化
- 结构体内存对齐
结构体传参
- 结构体实现位段(位段的填充&可移植性)
枚举
- 枚举类型的定义
- 枚举的优点
- 枚举的使用
联合
- 联合类型的定义
- 联合的特点
- 联合大小的计算
1.结构体
1.1 结构的基础知识
结构体是一些值的集合,这些值称为成员变量。结构体的每个成员可以是不同类型的变量。
1.2 结构体的声明
例如描述一个学生:
struct tag
{
member-list;
}variable-list;
struct Stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
}; //分号不能丢
1.3 特殊的声明
在声明结构体的时候,可以不完全的声明。
比如:
//匿名结构体类型
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}a[20], *p
匿名结构体在声明时,只用这一次,之后就不再使用。
上面的两个结构在声明的时候省略掉了结构体标签(tag)。
那么问题来了?
//在上面代码的基础上,下面的代码合法吗?
p = &x;
警告:
哪怕成员一样,编译器还是会把上面的两个声明当成完全不同的两个类型。
所以是非法的。
1.4 结构体的自引用
在结构中包含一个类型为该结构本身的成员是否可以呢?
//代码1
struct Node
{
int data;
struct Node next;
};
//可行否?
正确的自引用方式:
//代码2
struct Node
{
int data;
struct Node* next;
};
1.5 结构体变量的定义和初始化
struct Point
{
int x;
int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
//初始化:定义变量的同时赋初值。
struct Point p3 = {x, y};
struct Stu //类型声明
{
char name[15];//名字
int age; //年龄
};
struct Stu s = {"zhangsan", 20};//初始化
struct Node
{
int data;
struct Point p;
struct Node* next;
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化
1.6内存对齐
//练习1
struct S1
{
char c1;
int i;
char c2;
};
printf("%d\n", sizeof(struct S1));
//练习2
struct S2
{
char c1;
char c2;
int i;
};
printf("%d\n", sizeof(struct S2));
结果
12
8
第一条与第二条输出不同,说明类型的不同声明顺序会影响结构体内存大小。
这就是结构体内存对齐的结果。
那么要如何计算结构体内存?首先得掌握结构体的对齐规则:
1. 第一个成员在与结构体变量偏移量为0的地址处。
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。
VS中默认的值为8
3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
前两条分析如图,根据成员内存大小与默认对齐数比较,取较小值为对齐数。第一个成员c1在偏移量为0的地址处,第二个i 在4的整数倍地址处,(1,2,3不是4的整数倍) ,第三个c2在1的整数倍地址处(8为1的整数倍)。
根据第三条,其中最大对齐数为4,与默认对齐数取最小min(4,8) ,得到4,那就把整体内存9,对齐到下一个4的整数倍,如图
黑色块表示结构体内存中被浪费掉的空间。
offsetof ()可以返回结构体成员的偏移量。
//练习3
struct S3
{
double d;
char c;
int i;
};
printf("%d\n", sizeof(struct S3));
//练习4-结构体嵌套问题
struct S4
{
char c1;
struct S3 s3;
double d;
};
printf("%d\n", sizeof(struct S4));
嵌套结构体内存对齐同理,整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
16
32
为什么存在内存对齐?
性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访
问。
简单来说,结构体内存对齐就是拿空间换时间的做法。
既要满足对齐,又要节省空间的做法:
让占用空间小的成员尽量在一起。
1.7 修改默认对齐数
#pragma 这个预处理指令可以改变我们的默认对齐数。
#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
//输出的结果是什么?
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
return 0;
}
1.8 结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
上面的 print1 和 print2 函数哪个好些?
答案是:首选print2函数。
原因:函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的
下降。
结论:
结构体传参的时候,要传结构体的地址。
2.位端
2.1 位端基础
学完了结构体,就可以用结构体来实现一下位端。
1.位段的成员必须是 int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字(占用比特位)。
struct s
{
int _a : 2;
int _b : 3;
int _c : 10;
}s1;
printf("%d", sizeof(s1));
程序没有打印12,而是打印了4。因为,a占了2个比特,bc以此类推。整体大小只有15,小于一个整形所以只用四个字节。
2.2 位端内存分配
1.位端成员是unsigned int / int /char 。
2.按1个字节(char)/4个字节(int)开辟内存空间。
3.位端有不确定性,注意可移植程序应该避免使用位端。
当成员向内存申请空间发现不够时,内存会多开辟一块,但是该成员在内存上是如何分布的,在C中没有标准,不同编译器,运行结果可能会不同,因此移植可能具有差异性。
2.3 位段的跨平台问题
1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结:
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。
2.4 位端应用
网络数据包
3.枚举
枚举顾名思义就是一一列举。
把可能的取值一一列举。
3.1 枚举类型的定义
enum GameConsle
{
Nintendo_Switch,
PS4,
XSX
};
enum GameConsle myGC = Nintendo_Switch;
{}中的内容是枚举类型的可能取值,也叫 枚举常量 。
这些可能取值都是有值的,默认从0开始,一次递增1,当然在定义的时候也可以赋初值。
enum Color//颜色
{
RED=1,
GREEN=2,
BLUE=4
};
3.2 枚举的优点
为什么使用枚举?
我们可以使用 #define 定义常量,为什么非要使用枚举?
枚举的优点:
1. 增加代码的可读性和可维护性
2. 和#define定义的标识符比较枚举有类型检查,更加严谨。
3. 防止了命名污染(封装),#define全局都能用。
4. 便于调试 (预编译后,不会像#define ,把变量替换成常量)
5. 使用方便,一次可以定义多个常量
4. 联合(共用体)
4.1 联合类型的定义
联合也是一种自定义类型,其变量包含一系列成员,特征是共用一块内存空间,所以也叫共用体。
//联合类型的声明
union Un
{
char c;
int i;
};
//联合变量的定义
union Un un;
//计算连个变量的大小
printf("%d\n", sizeof(un));
4.2 联合的特点
printf("%p\n", &un);
printf("%p\n", &un.c);
printf("%p\n", &un.i);
结果
0077F718
0077F718
0077F718
结果发现,联合体的成员地址都指向同一块,这意味着修改一个成员变量的同时,另一个成员变量也会被修改。
//下面输出的结果是什么?
un.i = 0x11223344;
un.c = 0x55;
printf("%x\n", un.i);
c改变了第一个字节的内存数据
11223355
也可以利用这个特点,判断运行环境是大端还是小端。上面的例子,c指向第一位,改变了低位的44,说明是小端;如果改变的是高位的11,说明是大端。
4.3 联合大小的计算
- 联合的大小至少是最大成员的大小。
- 当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
union Un
{
short arr[7];//14 -2
int i;//4 -4
}u;
printf("%d", sizeof(u));
16
结果并不是14,而是16: 最大成员大小14不是最大对齐数4的整数倍,所以整体大小对齐到4的下一个整数倍16。