结构体
1 结构体的声明
1.1 结构的基础知识
- 结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
1.2 结构的声明
struct tag
{
member-list;
}variable-list;
例如描述一个学生:
struct Stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
}s1,s2; //分号不能丢
// s1,s2是根据struct stu 结构体类型创造出的结构体变量(为全局变量,如果放在主函数中,则为局部变量)
int main()
{
struct Stu s3;//s3是局部变量
return 0;
}
1.3 特殊的声明
- 匿名结构体类型,只能使用一次
struct // 省略掉了结构体标签(tag)。
{
//学生的相关属性
char name[20];
int age;
}s1;
int main()
{
return 0;
}
- 思考下面这个问题
//匿名结构体类型
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}a[20], *p;
上面的两个结构在声明的时候省略掉了结构体标签(tag)。
那么问题来了?
//在上面代码的基础上,下面的代码合法吗?
p = &x;
警告:
由于没有结构体标签,编译器会把上面的两个声明当成完全不同的两个类型。所以是非法的。
1.4 结构的自引用
1.4.1 在结构中包含一个类型为该结构本身的成员是否可以呢?
// 代码1(err)
struct Node
{
int data;//4
struct Node next;
};
int main()
{
sizeof(struct Node); // 如果这样写,根本无法计算struct Node结构体类型的大小
return 0;
}
// 代码2(正确的自引用方式:)
struct Node
{
int data;
struct Node* next; // 存储struct Node类型结构体对象的地址
};
//代码3(err)
typedef struct
{
int data;
Node* next;
}Node;
// 如果这样书写不能够确定是先有Node类型;还是先给结构体重新命名为Node,再有Node* next
//解决方案:
typedef struct Node
{
int data;
struct Node* next;
}Node;
// 代码4(给结构体指针重命名)
//法一
typedef struct Node
{
int data;
struct Node* next;
}* linklist; // 将结构体指针struct Node* 重新命名为linklist
//法二
struct Node
{
int data;
struct Node* next;
};
typedef struct Node* linklist;
1.5 结构体变量的定义和初始化
struct Point
{
int x;
int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
//初始化:定义变量的同时赋初值。
struct Point p3 = {x, y};
struct Stu //类型声明
{
char name[15];//名字
int age; //年龄
};
struct Stu s = {"zhangsan", 20};//初始化
struct Node
{
int data;
struct Point p;
struct Node* next;
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化
1.6 结构体内存对齐
1.6.1 如何计算结构体内存?
- 首先得掌握结构体的对齐规则
-
第一个成员在与结构体变量偏移量为0的地址处。
-
其他成员变量要对齐到对应成员变量某个数字**(对齐数)**的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数(VS中默认的值为8) 与 该成员大小的较小值。
-
结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
-
如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍
练习1
#define _CRT_SECURE_NO_WARNINGS
#include <stdio.h>
int main()
{
struct S1
{
char c1;
int i;
char c2;
};
printf("%d\n", sizeof(struct S1));
return 0;
}
// 打印结果为12
- 分析如下
练习2
#define _CRT_SECURE_NO_WARNINGS
#include <stdio.h>
int main()
{
struct S2
{
char c1;
char c2;
int i;
};
printf("%d\n", sizeof(struct S2));
return 0;
}
// 打印结果为8
- 分析如下
练习3
#define _CRT_SECURE_NO_WARNINGS
#include <stdio.h>
int main()
{
struct S3
{
double d; // 默认对齐数为8 d为 8(d所占内存空间的大小,单位为byte)较小值 为8,则对齐数为8
char c; // 默认对齐数为8 c为 1 则对齐数为1
int i; // 默认对齐数为8 i 为 4 则对齐数为4
};
printf("%d\n", sizeof(struct S3));
return 0;
}
// 打印结果为16
- 分析如下
练习4(结构体嵌套问题)
#define _CRT_SECURE_NO_WARNINGS
#include <stdio.h>
struct S3
{
double d;
char c;
int i;
};
struct S4
{
char c1; // 默认对齐数为8 c1为 1(c1所占内存空间的大小,单位为byte)较小值 为1,则对齐数为1
struct S3 s3;// 默认对齐数为8 s3为 16 较小值为8,则对齐数为8
double d; // 默认对齐数为8 d为8 较小值为8,则对齐数为8
};
int main()
{
printf("%d\n", sizeof(struct S4));
return 0;
}
// 打印结果为32
-
分析如下
-
如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,
-
结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍
为什么存在内存对齐?
1.平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2.性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
总体来说:
结构体的内存对齐是拿空间来换取时间的做法。
那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:
//例如:
#define _CRT_SECURE_NO_WARNINGS
#include <stdio.h>
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
char c2;
int i;
};
int main()
{
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
return 0;
}
//经过上面的练习,我们可以得出结论:让占用空间小的成员尽量集中在一起。
// 打印结果为12和8
S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别。
1.7修改默认对齐数
#pragma once
// 头文件中使用,功能是:防止头文件被多次引用
#pragma pack(4) //设置默认对齐数为4
struct S
{
int i;
double d;
};
#pragma pack() //取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack() //取消设置的默认对齐数,还原为默认
int main()
{
printf("%d\n", sizeof(struct S)); // 打印结果为12
printf("%d\n", sizeof(struct S1)); // 打印结果为6
return 0;
}
1.8 结构体传参
struct S
{
int data[1000];
int num;
};
void print1(struct S ss)
{
int i = 0;
for (i = 0; i < 3; i++)
{
printf("%d ", ss.data[i]);
}
printf("%d\n", ss.num);
}
void print2(const struct S* ps)
{
int i = 0;
for (i = 0; i < 3; i++)
{
printf("%d ", ps->data[i]);
}
printf("%d\n", ps->num);
}
int main()
{
struct S s = { {1,2,3}, 100 };
print1(s); //传值调用
print2(&s); //传址调用
return 0;
}
- 上面的 print1 和 print2 函数哪个好些?
答案是:首选print2函数。
原因:
- 函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
- 2.如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降
- 结论:
结构体传参的时候,要传结构体的地址。
2. 位段
2.1 什么是位段
位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是 int、unsigned int 或signed int (整型就可以)。
2.位段的成员名后边有一个冒号和一个数字。
比如:
struct A {
int _a:2; //表示a需要2个bit位
int _b:5; //表示b需要5个bit位
int _c:10; //表示c需要10个bit位
int _d:30; //表示d需要30个bit位
};
int main()
{
printf("%d\n", sizeof(struct A));
return 0;
}
// A就是一个位段类型。那位段A的大小是多少?
// 经过运行打印结果为 64bit
2.2 位段的内存分配
-
位段的成员可以是
int
,unsigned int
,signed int
或者是char
(属于整形家族)类型 -
位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
-
位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
//一个例子
#pragma once
#include<stdio.h>
struct S {
char a : 3;
char b : 4;
char c : 5;
char d : 4;
};
int main()
{
struct S s = { 0 };
printf("%d\n", sizeof(struct S));
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
return 0;
}
// 打印结果为3字节
//空间是如何开辟的?
- 解析如下
2.3 位段的跨平台问题
-
int 位段被当成有符号数还是无符号数是不确定的。
-
位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。
-
位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
-
当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结:
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。
2.4 位段的应用
- 封装数据包
3. 枚举
-
枚举顾名思义就是一一列举。
-
把可能的取值一一列举。
-
比如我们现实生活中:
一周的星期一到星期日是有限的7天,可以一一列举。
性别有:男、女、保密,也可以一一列举。
月份有12个月,也可以一一列举
这里就可以使用枚举
3.1 枚举类型的定义
enum Day//星期
{
Mon,
Tues,
Wed,
Thur,
Fri,
Sat,
Sun
};
enum Sex//性别
{
MALE,
FEMALE,
SECRET
};
enum Color//颜色
{
RED,
GREEN,
BLUE
};
-
以上定义的 enum Day , enum Sex , enum Color 都是枚举类型。{}中的内容是枚举类型的可能取值,也叫 枚举常量 。
-
这些可能取值都是有值的,默认从0开始,一次递增1,当然在定义的时候也可以赋初值。
//例如
// 不初始化时的默认打印值
enum Day//星期
{
Mon,//0
Tues,//1
Wed,//2
Thur,//3
Fri,//4
Sat,//5
Sun//6
};
// 初始化之后的打印值
enum Day//星期
{
//枚举常量
Mon=1, //1
Tues, //2
Wed, //3
Thur, //4
Fri, //5
Sat, //6
Sun //7
};
int main()
{
printf("%d\n", Mon);
printf("%d\n", Tues);
printf("%d\n", Wed);
printf("%d\n", Thur);
printf("%d\n", Fri);
printf("%d\n", Sat);
printf("%d\n", Sun);
return 0;
}
3.2 枚举的优点
- 为什么使用枚举?
我们可以使用 #define 定义常量,为什么非要使用枚举?
枚举的优点:
- 增加代码的可读性和可维护性
enum Option
{
EXIT,
ADD,
DEL,
SEARCH,
MODIFY,
SHOW,
SORT
};
void menu()
{
printf("*********************************************\n");
printf("****** 1. add 2. del *******\n");
printf("****** 3. search 4. modify *******\n");
printf("****** 5. show 6. sort *******\n");
printf("****** 0. exit *******\n");
printf("*********************************************\n");
}
int main()
{
int input = 0;
Contact con;//通讯录
//初始化通讯录
InitContact(&con);
do
{
menu();
printf("请选择:>");
scanf("%d", &input);
switch (input)
{
case ADD: //这样看起来就很方便
AddContact(&con);
break;
case DEL:
DelContact(&con);
break;
case SEARCH:
SearchContact(&con);
break;
case MODIFY:
ModifyContact(&con);
break;
case SHOW:
ShowContact(&con);
break;
case SORT:
SortContact(&con);
break;
case EXIT:
SaveContact(&con);
DestroyContact(&con);
printf("退出通讯录\n");
break;
default:
printf("选择错误\n");
break;
}
} while (input);
return 0;
}
- 和#define定义的标识符比较枚举有类型检查,更加严谨。
enum Color//颜色
{
RED=1,
GREEN=2,
BLUE=4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值,才不会出现类型的差异。
clr = 5; //ok
// 如果这样进行赋值,会因为类型不同而报错;clr类型是 enum Color; 5是整型
-
防止了命名污染(封装)
-
便于调试
- 在调试时,#define 定义的常量会为数值,不方便观察
- 使用方便,一次可以定义多个常量
4. 联合(共用体)
- 联合也是一种特殊的自定义类型
这种类型定义的变量也包含一系列的成员,特征是这些成员共用同一块空间(所以联合也叫共用体)。
// 例如
union Un
{
int a; //4
char c;//1
};
//共用
int main()
{
union Un u;
u.a = 0x11223344;
u.c = 0x00;
printf("%d\n", sizeof(u)); //打印结果为4
printf("%p\n", &u); //&u, &(u.a), &(u.c) 打印结果相同,指针都是从开辟空间的起始位置开始的
printf("%p\n", &(u.a));
printf("%p\n", &(u.c));
// a和c公用4个字节的空间
// u.c 会覆盖掉最后1字节的空间
printf("%x\n", u.a); // 打印结果是0x11223300
printf("%x\n", u.c); // 打印结果是0
return 0;
}
判断当前计算机的大小端存储
// 法一
int check_sys1()
{
int a = 1;
return *(char*)&a;
}
// 法二
int check_sys2()
{
union
{
char c;
int i;
}u;
u.i = 1;
//返回1是小端,返回0是大端
return u.c;
}
int main()
{
//int a = 1;//0x 00 00 00 01
//低-------> 高 (假设地址由低到高)
//01 00 00 00 -- 小端 (VS是小端存储)
//00 00 00 01 -- 大端
int ret = check_sys1();
//int ret = check_sys2();
if (ret == 1)
printf("小端\n");
else
printf("大端\n");
return 0;
}
4.2 联合的特点
- 联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)。
union Un
{
int i;
char c;
};
int main()
{
union Un un;
// 下面输出的结果是一样的吗?
printf("%d\n", &(un.i));
printf("%d\n", &(un.c));
//下面输出的结果是什么?
un.i = 0x11223344;
un.c = 0x55;
printf("%x\n", un.i);
return 0;
}
4.3 联合大小的计算
-
联合的大小至少是最大成员的大小。
-
当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
//比如:
union Un1
{
char c[5];
int i;
};
union Un2
{
short c[7]; //1个short类型占2字节,7个占14字节
int i;
};
//下面输出的结果是什么?
printf("%d\n", sizeof(union Un1));
printf("%d\n", sizeof(union Un2));
0 01 – 大端
int ret = check_sys1();
//int ret = check_sys2();
if (ret == 1)
printf("小端\n");
else
printf("大端\n");
return 0;
}
## **4.2** **联合的特点**
- 联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)。
```c
union Un
{
int i;
char c;
};
int main()
{
union Un un;
// 下面输出的结果是一样的吗?
printf("%d\n", &(un.i));
printf("%d\n", &(un.c));
//下面输出的结果是什么?
un.i = 0x11223344;
un.c = 0x55;
printf("%x\n", un.i);
return 0;
}
[外链图片转存中…(img-Livg2DfN-1711610204200)]
4.3 联合大小的计算
-
联合的大小至少是最大成员的大小。
-
当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
//比如:
union Un1
{
char c[5];
int i;
};
union Un2
{
short c[7]; //1个short类型占2字节,7个占14字节
int i;
};
//下面输出的结果是什么?
printf("%d\n", sizeof(union Un1));
printf("%d\n", sizeof(union Un2));