结构体
- 结构体类型的声明
- 结构的自引用
- 结构体变量的定义和初始化
- 结构体内存对齐
- 结构体传参
- 结构体实现位段(位段的填充&可移植性)
枚举
- 枚举类型的定义
- 枚举的优点
- 枚举的使用
联合
- 联合类型的定义
- 联合的特点
- 联合大小的计算
结构体类型的声明
什么是结构体声明,是否跟变量的声明一样,那我们一起来探讨一下
struct tag
{
member-list;
}variable-list;
//学生的信息
struct Stu
{ char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号 };
特殊的声明
匿名结构体,顾名思义,就是没有名称的,也是只需要使用一次的。或者是函数内的,比如配置,web开发渲染模板时候使用。
我们可以在这个定义之后的程序中,去使用这个类型struct test
如:
1.struct test
{
int age;
char num[10];
}
struct test t1,t2,t3 ;//声明了三个此种类型的变量,这个我们可以这样实现
也可以这样实现
2.struct test
{
char num[10];
int age;
} tea1,tea2,tea3;
3.struct
{
char num[10];
int age;
} tea1,tea2,tea3; //这里定义了一个无名的结构体,同时声明了三个此种类型的变量。
但是,因为没有名字,我们在这句之后,无法再定义与tea1,tea2 tea3相同类型的变量了。除非你再次去定义一个这样的相同的结构体类型。
思考一下这行代码能实现吗?
答案显然是不行的
编译器会报错两个类型不相同
下面那个ps是结构体指针变量
上面sb1是结构体变量
就算两个结构体成员一模一样,但实际编译器会把他们当成不同类型。所以ps不能存放sb1的地址。
结构的自引用
在结构中包含一个类型为该结构本身的成员是否可以呢?
- 就是在结构体内部,包含指向自身类型结构体的指针
错误的方式:
struct Node
{
int data;
struct Node next;
};
这种声明是错误的,因为这种声明实际上是一个无限循环,成员next是一个结构体,next的内部还会有成员是结构体,依次下去,会无限循环。在分配内存的时候,由于无限嵌套,也无法确定这个结构体的长度,所以这种方式是非法的.
正确的方式:使用我们的指针
struct Node
{
int data;
struct Node* next;
};
思考一下为什么指针可以?
是由于指针的长度是确定的(在32位机器上指针长度为4),所以编译器能够确定该结构体的长度。
我们在思考思考,能否用typedef来实现我们想要的效果.
错误的方式:
typedef struct {
int value;
NODE *link;
} NODE;
这里的目的是使用typedef为结构体创建一个别名NODE。但是这里是错误的,因为类型名NODE的作用域是在语句的结尾开始,所以在这个结构体内部不能识别NODE类型名,所以是不能使用的。
正确的方式:
struct tag_2;
typedef struct tag_2 NODE;
struct tag_2{
int value;
NODE *link;
};
结构体变量的定义和初始化
这里不过多介绍了!!比较简单,可自行百度。
结构体内存对齐(很重要)
为什么会有结构体内存对齐这个东西?
1. 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特 定类型的数据,否则抛出硬件异常。
2. 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访 问。
什么是栈呢,先简单介绍下,栈上的地址是向下增长的,一般存的是局部变量的数据和函数参数的数据。
总体来说:
结构体的内存对齐是拿空间来换取时间的做法。
那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:
让占用空间小的成员尽量集中在一起。
我们来看看第二句话的效果。
如果数据大的时候,节省的空间就很多了
修改默认对齐数
之前我们见过了 #pragma 这个预处理指令,这里我们再次使用,可以改变我们的默认对齐数。
#pragma pack(8)//设置默认对齐数为8
#pragma pack()//还原默认对齐数
vs编译器下的默认对齐数是8
结论:
结构在对齐方式不合适的时候,我么可以自己更改默认对齐数。
结构体传参
两种方式:传地址和传值
struct S
{
int data[1000];
int num;
};
struct S s = { {1,2,3,4}, 1000 };
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
哪个更好,传地址更好,因为他不会在栈区上重新开个空间,节省了空间。
结构体实现位段(位段的填充&可移植性)
什么是位段
位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是 int、unsigned int 或signed int (整形家族)。
2.位段的成员名后边有一个冒号和一个数字。
位段的内存分配
1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
//一个例子
struct S
{
char a:3;
char b:4;
char c:5;
char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4; //空间是如何开辟的
创建的时候先创建一个字节的空间,a占3位,b占四位,但是我们在开辟c的空间是前面一个
字节不能容纳5个字节了,所以编译器根据c的数据类型又创一个字节的空间给c,但是这里一个字节的空间不能容纳四个字节,所以编译器又根据d的数据类型开辟了一个空间给d。
开辟的空间占用的内存不知道是从左还是从右分配的,这个只能根据编译器的处理方式,vs是从右依次分配。
第一个字节的数据
s.a=10,因为10的二进制是000001010,但是a只占3个位,把位长的数据放到位短的数据,会发生截断,所以去掉1,得101
s.b=12,12的二进制是00001100,b的空间可容纳12,得1100
所以第一个位01100101
第二个字节的数据
s.c=3,3的二进制是00000011,开辟的c的空间可以容纳,得11
所以第二个字节是00000011
第三个字节的数据
s.d=4,4的二进制是00000100,d的空间可以容纳,得100
所以第三个字节是00000100
所以我们看到内存数据是0x620304
但是有些小伙伴可能有疑问了,为什么数据不是倒着的,如果这样想的话那就大错特错了
因为这里是char类型。
那如果是int类型呢?
如果是int类型,就算分配的位数不是一个字节,他在内存中还是倒着放的(vs下)
内存分配例子
我们来学学结构体内存对齐规则
结构体内存对齐规则
第一条规则是默认的
第二条规则
第三条规则
因为最大对齐数是4;
第四条规则
所以这个字节长度为32
位段的跨平台问题
1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机 器会出问题。
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是 舍弃剩余的位还是利用,这是不确定的。
枚举
枚举顾名思义就是一一列举。
把可能的取值一一列举。
比如我们现实生活中
一周的星期一到星期日是有限的7天,可以一一列举。
枚举类型的定义
enum Day//星期 day是变量名 ,mon,tues这种是成员变量
{
Mon,
Tues,
Wed,
Thur,
Fri,
Sat,
Sun
};
enum Sex//性别
{
MALE,
FEMALE,
SECRET
};
enum Color//颜色
{
RED,
GREEN,
BLUE
};
以上定义的 enum Day , enum Sex , enum Color 都是枚举类型。 {}中的内容是枚举类型的可能取值,也叫 枚举常量
这些可能取值都是有值的,默认从0开始,一次递增1,当然在定义的时候也可以赋初值。 例如:
所以打印的时候都是数字。
我们思考一下 枚举类型的大小是多少?
为什么是4,因为枚举类型是整形常量的集合,也就是值的集合,并且这些值是可能取值的状态,所以只有四个字节。
枚举的使用
我们以通讯录为例子
这样写我们增加了代码的可读性,我们就不用去对应数字查找了。
联合(共用)体
联合类型的定义
联合也是一种特殊的自定义类型 这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间(所以联合也叫共用体)。 比如:
//联合类型的声明
union Un
{
char c;
int i;
};
//联合变量的定义
union Un un;
//计算连个变量的大小
printf("%d\n", sizeof(un));
思考一下这个字节大小是多少 ?
答案是4,因为联合体类型的成员共用一块空间,最少要容纳最大成员的字节大小,上述最大是int类型,所以是4.
联合的特点
联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联 合至少得有能力保存最大的那个成员)——上个问题中讲过。
那么看看还有什么特点,
先看一个例子
union Un
{
int i;
char c;
};
union Un un;
// 下面输出的结果是一样的吗?
printf("%p\n", &(un.i));
printf("%p\n", &(un.c));
//下面输出的结果是什么?
un.i = 0x11223344;
un.c = 0x55;
printf("%x\n", un.i);
两个成员的地址是一样的,那为什么是一样的呢?
因为他们是占用同一个空间,首地址相同。
判断当前计算机的大小端存储
用联合体更好
联合大小的计算
- 联合的大小至少是最大成员的大小。
- 当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
union Un1
{
char c[5];
int i;
};
union Un2
{
short c[7];
int i;
};
//下面输出的结果是什么?
printf("%d\n", sizeof(union Un1));
printf("%d\n", sizeof(union Un2));
根据的是第二条规则