自定义类型:结构体,枚举,联合
结构体
结构体类型的声明
1. 结构的基础知识
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同的变量。
struct Stu
{
char name[20];
int age;
fioat score;
}s1,s2,s3;
二者对照,一目了然。
2.特殊的声明
结构体在声明的时候可以不完全声明-匿名结构体类型
struct
{
char name[20];
char id[20];
}ss;
匿名结构体变量只能用一次,如果匿名结构体的成员都一样,但是在编译器看来也是不同类型的结构体
运行代码会报错
struct
{
char name[20];
int age;
}ss1;
struct
{
char name[20];
int age;
}*s;
int main()
{
s=&ss1;
return 0;
}
3.结构体的自引用
结构体中可以包含一个该结构体吗?
当然可以,举个例子,在数据结构中,线性数据结构有顺序表和链表两种。
结构体的自引用可以看成是像链表一样,通过一个数据可以找到下一个数据,像链条一样串起来,但是想要通过一个节点找到下一个节点,就要将节点划分为数据部分和指针部分,地址存放下一个节点的地址,这样就很好地串起来了,当然最后一个节点中存放的是空指针。
存放数据的区域叫数据域,存放指针的叫指针域
struct Node
{
int a;//数据
struct Node*next;//指针
};
4.结构体的定义和初始化
//结构体的定义和初始化
#include<stdio.h>
struct Book
{
char name[20];
int price;
char id[20];
}b1={"bit",34,"sc11245"};
struct Node
{
struct Book b;
struct Node* next;
};
int main()
{
struct Book s2 = { "grace",10,"tf44567" };
struct Node n = { {"bilibili",45,"aaasss223344"},NULL };
return 0;
}
5.结构体内存对齐
内存对齐讨论的是结构体的内存计算
struct S1
{
char c1;
int a;
char c2;
};
int main()
{
struct S1 s;
printf("%d\n",sizeof(s));
return 0;
}
这个代码最终会打印什么呢?
一般我们会这么想:c1,c2是char类型的变量,大小各是一个字节,a是int类型的变量,大小是4个字节,这样一共应该是6个字节,但是
实际上会打印12
可以发现s1和s2类型相同,但是却能打印出来不同的结果。
这里我们就会好奇了,为什么会打印不同的结果呢?结构体的内存究竟是如何计算的呢?
首先得掌握结构体对齐规则:
1.第一个成员在结构体变量偏移量为0的地址处。
2.其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。对齐数=编译器默认的一个对齐数与该成员大小的较小值。
VS中默认的对齐数是8,Linux环境下没有默认对齐数,自身大小就是对齐数。
3.结构体总大小为最大对齐数(每个成员都有一个对齐数)的整数倍。
举个例子:
C语言中有offsetof这样一个宏,这个宏可以计算结构体成员相对于其实位置的偏移量
其实内存对齐会导致一定程度的内存浪费,但是为什么操作系统仍然会进行内存对齐呢?
1.平台原因(移植原因)
不是所有硬件平台都能访问任意地址上的任意数据的,某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2.性能原因
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为访问未对齐的内容,处理器需要做两次内存访问,而对齐的内存只需要一次访问。
总体来说,结构体的内存对齐就是拿空间来换取时间的做法。
综合以上我们得出一个结论:在设计结构体的时候,既要满足对齐,又要节省空间,如何做到:让占用空间小的成员尽量集中在一起。
6.修改默认对齐数
使用pragma pack ( )
//修改默认对齐数为4
#pragma pack(4)
struct S
{
char c;
double d;
};
#pragma pack()
类似于这种方法,上面的#pragma pack( )是设置,下面的#pragma pack( )是取消,中间内容的默认对齐数被修改为设置括号内的数。但是如果把默认对齐数设置为1,那就是不对齐,但是这样的话数据读取会比较困难。
7.结构体传参
结构体传参有两种方法,一种是传递结构体,另外一种是传递结构体地址
struct S
{
int num;
}s={6};
//结构体传参
void test(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void test2(struct S*ps)
{
printf("%d\n", ps->num);
}
函数传参时,参数需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销就比较大,会导致性能的下降。
位段
1.什么是位段?
位段的声明和结构是相似的,但是有两个不同
struct S
{
int a;
int b;
int c;
int d;
};
struct B
{
int a:2;
int b:5;
int c:10;
int d:30
};
可以发现位段有冒号并且后面有数字
这里要注意:
位段的成员必须是:int,unsigned int,signed int或char
位段的成员名后面有一个冒号和一个数字
位段冒号后面的数字表示成员占用的比特位
位段不存在对齐
2.位段的内存分配
位段的空间是按照需要以四字节(int)或一字节(char)的方式开辟的。
位段涉及很多不确定的因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
举个例子来详细说明一下:
上面的例子struct B,程序开始先开辟了四个字节(int类型)的空间,换算就是32
个比特位,a占用了2个,b占用了5个,c占用了10个,这个时候还剩余15个比特
位的空间,是不足以装下d的,此时程序必然会继续开辟一块四个字节的空间,但
是会有一个问题,程序究竟会不会在之后的15个字节中存储?答案就是这个决定
权掌握在编译器手里,这也就是为什么位段是不跨平台的原因。
总结:与结构相比,尾端可以达到相同的效果 ,但是可以更好地节省空间,但是会有跨平台问题。
枚举
枚举的概念
枚举顾名思义就是把可能的取值一一列举
enum Sex
{
MALE;
FEMALE;
SECRET;
};
int main()
{
enum Sex s=MALE;
enum Sex s2=FEMALE;
return 0;
}
这是一个简单的枚举类型的使用,每一个枚举类型的可能取值都是有值的,这个值也可以进行更改。
#include<stdio.h>
enum Sex
{
MALE=4,
FEMALE,
SECRET
};
int main()
{
enum Sex s = MALE;
enum Sex s2 = FEMALE;
printf("%d %d %d", s, s2, SECRET);
return 0;
}
枚举的优点
- 增加代码的可读性和可维护性
- 和#define定义的标识符比较枚举有类型检索,更加严谨。
- 防止了命名污染
- 便于调试
- 使用方便,一次可以定义多个常量
如果使用#define定义值,程序会在预编译阶段就被改成对应的值,但是开始调试以后已经进行了预编译,因此不方便进行调试。
联合(共用体)
联合类型的定义
联合也是一种特殊的自定义类型
这种类型定义的变量也包含一系列的成员,特征是这些成员公用一块空间,所以联合体也叫共用体
通过两组程序可以发现,u中的c和i占用的是同一块大小位4个字节的空间,但是c只占一个字节,这块空间就会与i公用
联合的特点
联合的成员是公用同一块内存空间的,这样至少一个联合变量的大小,至少是最大成员的大小(联合体至少有能力保存最大的那个成员)
根据联合的特点,可以写代码来确定程序是大端存储还是小端存储。
#include<stdio.h>
union M
{
int a;
char b;
};
int test()
{
union M a;
a.a = 1;
return a.b;
}
int main()
{
if (test() == 1)
{
printf("小端存储");
}
else
printf("大端存储");
return 0;
}
联合体内存计算
对于联合体来说也是有内存对齐的
char的大小是1,int的大小是4,因此对齐数就是4,最终结果是8。
当最大成员的大小是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍
感谢阅读,希望大家学有所成,拿到自己满意的offer!