C语言----自定义结构类型
今天我们学习结构体,结构体是C语言非常重要的组成部分,是后续数据结构课程的基础(数据“结构”中的“结构”指的就是结构体)
一、结构体
结构体是你自己把一些数据(称为成员变量)以某种组织方式组织起来的一种自定义的数据类型
1.声明和自引用
结构体声明的抽象表示如下:
struct tag{
member-list;
}varible-list;
例如:一个学生
struct Stu{
int age;
char name[20];
int height;
char stu-number[8];//学号
} stu1,stu2;
这里表示一个学生结构体,包含年龄、姓名、身高、学号,并且定义了stu1和stu2两个变量
匿名定义:
struct {
int a;
char c;
long long d;
} x;
这就构造了一个匿名的结构体x,它没有标签
struct {
int a;
char c;
long long d;
} *px;
px=*x//这个写法是错误的,尽管这俩结构体成员一摸一样,但是还是两种不同的类型
匿名结构体类型类似于“一次性用品”,当以后再用它的时候,因为它没有标签,也无法再创建相同类型的变量。所以建议以后用不到的时候再定义这种结构体。(但是可以用typedef来为匿名结构体命名)
结构体还经常要用到自引用,试判断以下两个代码是否正确:
struct node{
int val;
struct node next;
};
typedef struct node{
int val;
Node* next;
}Node;
很遗憾,两个代码都是不对的。第一个代码中,struct node 里嵌套struct node,那么将会无限套娃,系统甚至无法判断该给struct node 多少空间,所以这个代码是错的
对于第二个代码,自引用时使用了指针,这本身没问题,但是使用typedef重命名结构体时,整个结构体创建完成之后才有Node这个名字,但是这段代码在创建的过程中就使用了Node,在逻辑上也说不通,正确方法是把结构体中第二个成员变量的类型改成struct node *
结构体赋值或初始化时,需要用大括号把各成员变量按顺序初始化:
typedef struct node {
int val;
struct node *next;
} Node;
Node a={7,NULL};//有一个int类型和一个struct node *类型
2.结构体的内存对齐(重点,面试常考)
这里先抛出几个问题,可以尝试着先算一算:
//练习1
struct S1
{
char c1;
int i;
char c2;
};
printf("%d\n", sizeof(struct S1));
//练习2
struct S2
{
char c1;
char c2;
int i;
};
printf("%d\n", sizeof(struct S2));
//练习3
struct S3
{
double d;
char c;
int i;
};
printf("%d\n", sizeof(struct S3));
//练习4-结构体嵌套问题
struct S4
{
char c1;
struct S3 s3;
double d;
};
printf("%d\n", sizeof(struct S4));
这些sizeof如何计算???
这就需要介绍关于结构体内存对齐的有关知识了
首先给出对齐规则:
- 第一个成员在与结构体变量偏移量为0的地址处。
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。
VS中默认的值为8 gcc下没有默认对齐数(对齐数就是成员自身大小)
- 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
- 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
意思就是说把这个结构体看成一个正常的成员变量(和其他数据类型一样)
…
如果在计算对齐数的时候遇到数组,可以把数组展开
不理解?那下面画个图来分析一下,如下图,对于S1,第一个成员是c1,放在起始处(0偏移),然后从i开始,默认对齐数为8,sizeof(int)=4,所以它的位置需要对齐到min(4,8)的整数倍,最近的就是4,所以i为4-7,同理,c2的对齐数是1,直接放下面,此时总大小为9,需要对齐为最大对齐数(4)的整数倍(12),所以下面再开三个空间,所以S1的大小为12
以此类推,S2大小为8
//一个嵌套结构体的例子
struct S1
{
double i;
char ch;
int x;
}
struct S2
{
char c;
struct S1 s;
double x;
}
printf("%d",sizeof(struct S2));
1.S2里首先在0偏移处放c。
2.(S1请读者自己分析)s1里最大对齐为8,那么s2里在8的位置放S1,共16B,double对齐数为8,24处开始放,共8B,到31偏移处
3.此时S2大小32正好为最大对齐数(max(1,8,8))的整数倍。所以最终S2大小为32.
为什么存在内存对齐?
- 平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。 - 性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
总的来说,内存对齐是拿空间换时间的做法
所以在设计结构体时,为了既满足对齐,又节省空间,尽量做到:让占用空间小的成员尽量集中。
struct s1{
char c1;
int val;
char c2;
};
struct s2{
char c1;
char c2;
int val;
};
//s1和s2谁更占空间?
另外还可以在程序中修改默认对齐数
#pragma pack(n)//修改默认对齐数为n
#pragma pack()//还原对齐数为默认
再介绍一个宏offsetof,可以计算结构体中某变量的偏移值
offsetof(type,member)//需要包含头文件:<stddef.h>
读者可以自行实现这个宏的功能。
3.结构体传参
struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}//比较一下哪个更好
答案是第二种,也就是传址。
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
如果害怕传址会改变原结构体的值,那么就加一个const使得指针不能改变这个结构体的值
二、位段
位段和结构声明很相似,但是也有不同
1.定义
struct A
{
int _a:2;
int _b:5;
int _c:10;
int _d:30;
};
位段与结构的差别:
1.位段的成员必须是整型家族(int/char)
2.位段的成员名后面有一个冒号和一个数字
2.内存分配
那么1中定义位段的大小是多少呢?
(肯定不是4*4=16)
printf("%d\n",sizeof(struct A));
打印可得,结果为8.
位段的内存分配规则:
由于位段具有不确定性,不能跨平台,在每一个编译器下可能不同,这里只介绍VS下的位段:
先初始化一下:
s.a=3;
s.b=12;
s.c=3;
s.4=4;
在结构体声明和成员定义中给的值(2、5、10、30)表示变量所占的二进制位
3.跨平台和应用
位段的优缺点:
优点:相比于结构更节省空间;
缺点:1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
应用:网络协议报文
三、枚举
1.定义
顾名思义,枚举就是一一列举。
2.使用和优点
声明:
enum Day//星期
{
Mon,
Tues,
Wed,
Thur,
Fri,
Sat,
Sun
};
enum Sex//性别
{
MALE,
FEMALE,
SECRET
};
enum Color//颜色
{
RED,
GREEN,
BLUE
};
以上定义的 enum Day , enum Sex , enum Color 都是枚举类型。
{}中的内容是枚举类型的可能取值,也叫 枚举常量 。
需要说明的是:这些都是有值的,默认从0开始逐个加1,也可以初始化的时候赋值。如:
enum Color//颜色
{
RED=1,
GREEN=2,
BLUE=4
};
当然也可以部分赋值,规则还是从上到下逐加一。
相比于直接用#define定义常量,使用枚举的优点:
- 增加代码的可读性和可维护性
- 和#define定义的标识符比较枚举有类型检查,更加严谨。
- 防止了命名污染(封装)
- 便于调试
- 使用方便,一次可以定义多个常量
使用
enum Color//颜色
{
RED=1,
GREEN=2,
BLUE=4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值,才不会出现类型的差异。
clr = 5; //ok??
四、联合体
1.定义
联合体又称为共用体,这种类型定义的变量也包含一系列的成员,其主要特征是这些成员公用同一块空间
//联合类型的声明
union Un//联合体用union关键字
{
char c;
int i;
};
//联合变量的定义
union Un un;
//计算联合体变量的大小
printf("%d\n", sizeof(un));
2.特点和计算
联合的成员共用同一块内存空间,因此一个联合变量的大小,至少是最大成员的大小(因为联
合至少得有能力保存最大的那个成员)。
也因为共用一块空间,联合体成员在使用的时候只能一次用一个成员,因为改一个成员可能会改变其他成员的值
union Un
{
int i;
char c;
};
union Un un;
// 下面输出的结果是一样的吗?
printf("%d\n", &(un.i));
printf("%d\n", &(un.c));
//下面输出的结果是什么?
un.i = 0x11223344;
un.c = 0x55;
printf("%x\n", un.i);//作者的计算机输出是11223355
这个程序还能用来判断当前计算机是大段存储还是小端存储。下面是图解
联合体成员大小:
union Un1
{
char c[5];
int i;
};
union Un2
{
short c[7];
int i;
};
//下面输出的结果是什么?
printf("%d\n", sizeof(union Un1));//8 5--->4*2=8
printf("%d\n", sizeof(union Un2));//16 14--->4*4=16
计算方法:
1.至少是最大成员大小
2.是最大对齐数的倍数