自定义类型详解
自定义的类型有:结构体、联合体、枚举。
详解目录
结构体
1. 结构体类型的声明
1.1 结构体的基础知识
结构体是一些值的集合,这些值称为成员变量。结构体的每个成员可以是不同类型的变量。
1.2 结构体的关键字
结构体的关键字是:struct
1.3 结构体的声明
例如以下声明一个学生的大概信息:
struct student
{
char name[15];//名字
int age;//年龄
char sex[5];//性别
char ID[20];//学号
};
在声明结构体中,可以不安全声明——匿名结构体类型
struct
{
char name[15];//名字
int age;//年龄
char sex[5];//性别
char ID[20];//学号
}S;
匿名的结构体类型,如果没有对结构体类型重命名的话,基本上只能使⽤⼀次。
1.4 结构体的自引用
struct Node
{
int data;
struct Node* next;
};
1.5 使用typedef关键来重名名结构体
上面的关于学生信息的结构体,可以用typedef来重命名。
重命名后代码如下:
typedef struct
{
char name[15];//名字
int age;//年龄
char sex[5];//性别
char ID[20];//学号
}S;
2. 结构体变量的创建和初始化
已经掌握了结构体的类型,接下来就要创建变量和初始化了。
结构体变量的初始化使用:{ }
结构体变量的创建和初始化代码:
struct ProInof
{
char name[10];
int age;
};
int main()
{
struct ProInof stu = {"张三",31};//给结构体初始化
return 0;
}
指⽰器初始化⽅式(C99),这种方式允许不是按照成员顺序初始化。
int main()
{
struct ProInof stu = {.age=30,.name="张三"};//给结构体初始化
return 0;
}
3. 结构体访问操作符
- 结构体变量.成员变量名
- 结构体指针—>成员变量名
结构体变量.成员变量名
代码展示:
struct ProInof
{
char name[10];//名字
int age;//年龄
};
void print(struct ProInof* ps)
{
printf("%s %d\n",ps->name,ps->age);//进行访问打印
}
int main()
{
struct ProInof stu = { "李四",20 };//给结构体初始化
printf("%s %d\n",stu.name ,stu.age);//进行访问打印
print(&stu);
return 0;
}
输出结果:
4.结构体的内存对齐
4.1 结构体内存对齐的规则
⾸先得掌握结构体的对⻬规则:
- 结构体的第⼀个成员对⻬到相对结构体变量起始位置偏移量为0的地址处
- 其他成员变量要对⻬到某个数字(对⻬数)的整数倍的地址处。
对⻬数 = 编译器默认的⼀个对⻬数 与 该成员变量⼤⼩的较⼩值。
VS编译器中默认的对齐数为8
Linux中没有默认对⻬数,对⻬数就是成员⾃⾝的⼤⼩- 结构体总⼤⼩为最⼤对⻬数(结构体中每个成员变量都有⼀个对⻬数,所有对⻬数中最⼤的)的整数倍。
- 如果嵌套了结构体的情况,嵌套的结构体成员对⻬到⾃⼰的成员中最⼤对⻬数的整数倍处,结构体的整体⼤⼩就是所有最⼤对⻬数(含嵌套结构体中成员的对⻬数)的整数倍。
以下举例说明
4.2 为什么会存在内存对齐
⼤部分的参考资料都是这样说的:
- 平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。- 性能原因:
数据结构(尤其是栈)应该尽可能地在⾃然边界上对⻬。
总体来说:结构体的内存对⻬是拿空间来换取时间的做法。
要满足对齐,既要节约空间的一个小建议:
让占用空间小的成员尽量集中一起。
5.修改默认对齐数
#pragma 这个预处理指令,可以改变编译器的默认对⻬数。
#pragma pack(4) //修改VS编译器的默认对齐数为4
结构体在对⻬⽅式不合适的时候,我们可以⾃⼰更改默认对⻬数。
6. 结构体传参
struct Pro
{
char c;
int i;
};
void print1(struct Pro p)
{
printf("%c %d\n",p.c,p.i);
}
void print2(struct Pro* p)
{
printf("%c %d\n",p->c,p->i);
}
int main()
{
struct Pro p = { 'W',1000 };
print1(p);//传值
print2(&p);//传址
return 0;
}
这两种传参推荐使用:传址
原因有两个:
1.函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
2.如果传递⼀个结构体对象的时候,结构体过大,参数压栈的的系统开销⽐较大,所以会导致性能的下降。
结论:结构体传参的时候,要传结构体的地址。
7.结构体实现位段
7.1 什么是位段
位段的声明与结构体是相识的,但有两个不同:
- 位段的成员必须是int、unsigned int或signed int类型的,在C99中位段可以是其他类型。
- 位段的成员后面跟一个冒号和一个数字。
//位段的声明
struct A
{
int _a : 5;
int _b : 6;
int _c : 7;
};
7.2 位段的内存分配
- 位段的成员可以是 int unsigned int signed int 或者是 char 等类型
- 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的⽅式来开辟的。
- 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使⽤位段。
注意:位段后面的数字不可以大于32。
7.3 位段的跨平台问题
- int 位段被当成有符号数还是⽆符号数是不确定的。
- 位段中最⼤位的数⽬不能确定。(16位机器最⼤16,32位机器最⼤32,写成27,在16位机器会出问题。
- 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
- 当⼀个结构包含两个位段,第⼆个位段成员⽐较⼤,⽆法容纳于第⼀个位段剩余的位时,是舍弃剩余的位还是利⽤,这是不确定的。
总结:
跟结构相⽐,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在。
联合体
联合体也叫做共同体。
1.联合体的基础知识
联合体的关键字是:union
联合体的特点:共同使用一块空间。
联合体的成员是共同使用一块内存空间,这样一个联合变量的大小至少是最大成员的大小。(因为联合至少得有能力保存最大的那个成员)
2.联合体类型的声明
//联合体的声明
union UN
{
char a;
char b;
int i;
};
3.联合体大小的计算
- 联合的⼤⼩⾄少是最⼤成员的⼤⼩。
- 当最⼤成员⼤小不是最⼤对⻬数的整数倍的时候,就要对⻬到最⼤对⻬数的整数倍。
union Un1
{
char c[8];
int i;//最大对齐数
};
union Un2
{
short c[4];
int i;//最大对齐数
};
int main()
{
//下⾯输出的结果是什么?
printf("%zd\n", sizeof(union Un1));
printf("%zd\n", sizeof(union Un2));
return 0;
}
联合体的一个小练习
//写⼀个程序,判断当前机器是⼤端?还是⼩端?
int check()
{
union
{
char c;
int i;
}NU;
NU.i = 1;
return NU.c;
}
int main()
{
int ret=check();
if (ret == 1)
{
printf("小端\n");
}
else
{
printf("大端\n");
}
return 0;
}
枚举
1.枚举类型的声明
枚举就是一一列举
枚举的关键字:enum
//枚举类型声明一个星期
enum DAY//星期
{
MON,
TUES,
WED,
THUR,
FRI,
SAT,
SUN
};
{ }花括号里面的是枚举类型的可能取值,也叫枚举常量
他们的取值默认是从0开始,一次递增1,当然也可以在定义的时候赋初值。
enum Color//颜色
{
RED=5,
BULE,//6
GREEN//7
};
前面的赋初值后面的值也是一次递增1
2.枚举的优点
- 增加代码的可读性和可维护性
- 和#define比骄定义的标识符,枚举类型检查,比骄严谨。
- 防止命名污染
- 便于调试以及使用方便,一次可以定义多个常量。
- 枚举常量是遵循作⽤域规则的,枚举声明在函数内,只能在函数内使⽤
3.枚举的使用
enum Color//颜色
{
RED=5,
BULE,//6
GREEN
};
int main()
{
enum Color BU = BULE;
printf("%d\n",BU);
return 0;
}
输出结果:
总结
学自定义结构体,就可以更加方便的定义我们生活的一些东西。比如一本书、人、颜色等等。
学海无涯,永无止境