作者:喜欢猫咪的的程序员
专栏:《C语言》
喜欢的话:世间因为少年的挺身而出,而更加瑰丽。 ——《人民日报》
目录
前言:什么是自定义数据类型?
所谓自定义数据类型,就是用一个新名字重新对一个数据类型命名,后面新名字就有了该数据类型的功能,在调用该新名字时,就相当于调用该数据类型。
自定义数据类型包含不同的使用方法,每一个方法都有自己的关键字。
自定义类型的分类:
结构体类型,位段,枚举类型,联合体类型(共用体)。
结构体类型:
结构体的声明:
-
我们将结构内部的变量称为成员变量。
-
我们将下图的Struct Stu称为结构体类型。
-
结构体声明时,大括号后面需要有一个分号。
结构体的自引用:
结构体的自引用就是结构体内部包含了一个与它本身相同的结构体变量。
//代码1
struct Node
{
int data;
struct Node next;
};
//代码2
struct Node
{
int data;
struct Node* next;
};
这两个代码哪一个是可以将结构体变量next成功传给结构体的呢?
你应该有自己的答案了,我们来学习一下结构体存储的原理。
结构体是通过链表的方式存储的:
我们返回来继续看题目:
显然,代码1是错误的,而代码2是正确的。
我们先思考一个问题,代码1中,sizeof(struct Node*)的大小?
很明显这里sizeof计算不出大小,它会无线套娃而大小就变成不可计算的了,所以编译不通过也很正常。
而代码2中的sizeof(struct Node*)是可计算的,因为代码2中成员变量是一个指针,指针的大小都为4个字节大小。
所以我们在运用结构体自引用的时候,结构体成员变量得写成结构体指针才能编译过去。
结构体变量的定义和初始化:
有了结构体变量,那如何定义和初始化结构体呢?
struct Point
{
int x;
int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
//初始化:定义变量的同时赋初值。
struct Point p3 = {x, y};
struct Stu //类型声明
{
char name[15];//名字
int age; //年龄
};
struct Stu s = {"zhangsan", 20};//初始化
struct Node
{
int data;
struct Point p;
struct Node* next;
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化
结构体的内存对齐(计算结构体内存大小):
我们既然学会了然后定义结构体变量,那我们如何计算结构体内存大小呢?
结构体变量计算内存时有4个规则
我们先来看第一个规则:
第一个成员在与结构体变量偏移量为0的地址处。
我们首先要了解一个名称:偏移量
我们看下图我们将内存位置进行了编号
系统将第一个位置设为为0,其他的位置距离第一个位置的距离为偏移量
第二个规则:
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。
VS中默认的值为8
我们来讲解一下第二个规则:
我们首先来了解一下什么是对齐数。
在vs编译器下,我们的默认对齐数是8,
而默认对齐数涉及到一个知识点,默认对齐数是可以更改的!
如何更改如下:
利用#pragma pack(),括号内的写的数字就为设置的默认对齐数值,没有写数字就变为原来的默认对齐数8。
而每个成员变量的对起数,比如int 为4,char为1.
所以当我们int变量的对齐=8(默认对齐数)和4(int的对齐数)的较小值=4.
而我们一个成员变量要放在这个变量的整数倍的地址(偏移量)
struct S1
{
char c1;
int i;
char c2;
};
//printf("%d\n", sizeof(struct S1));
这个题目还没有解完,请看下一个图。
第三个规则:
3. 结构体字节总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
第四个规则:
4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整
体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
我们利用两个例子来讲解一下第三个和第四个规则:
struct S1//代码1
{
char c1;
int i;
char c2;
};
//printf("%d\n", sizeof(struct S1));
//练习2
struct S2
{
char c1;
char c2;
int i;
};
//printf("%d\n", sizeof(struct S2));
int mian()
{
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
return 0;
}
有上图我们可以知道,代码1中变量只占了偏移量0 4 5 6 7 8的位置,而这还没有完,我们将第三个规则和第四个规则运用进去。
我们不可以再将0~4字节的3个字节空间拿去给别的变量使用,所以要一起占用,因此会造成内存浪费。
因为代码1中,两个char型的对齐数为1,而int型的对齐数为4,所以最大对齐数为4.
所以最后结构体的字节大小应该是4(最大对齐数)的整数倍。
而我们目前占的偏移量最大为8,这样的话我们就是9个字节。所以我们为了让结构体大小为最大对齐数的整数倍,我们还得占3个字节大小,也就是一直占到偏移量为11的位置。
因为代码1和代码2都没有涉及到嵌套了结构体,所以都没有运用第四个规则,我后再讲解一个例题来讲解这个第四个规则。
代码2就不给大家详细讲解了,内存占比画了出来,如下:
我们用以下这个例子来讲解一下第四个规则:
struct S3
{
double d;
char c;
int i;
};
struct S4
{
char c1;
struct S3 s3;
double d;
};
int mian()
{
printf("%d\n", sizeof(struct S3));
printf("%d\n", sizeof(struct S4));
return 0;
}
我们发现s4中嵌套了s3,我们算出来s3的字节大小为16,最大对齐数为8
而我们嵌套了s3,要放在这个变量的最大对齐数的整数倍,也就是s3的对齐数的整数倍(8)
在偏移量8前面的内存也得占用,形成了浪费了。
而我们将嵌套的结构体(s3)的内存空间找到了,我们我偏移量来到了23,下一个偏移量空间的编号为24,而s4的下一个变量刚好是对齐数为8的double型,刚好可以放进去(如果嵌套的结构体的下一个编号不是8的整数倍,我们也得找到下一个8的整数倍放进去,浪费空间没有办法避免)
我们将d的内存空间找到了刚好来到偏移量为30
然后这个s4的最大对齐数为8,所以s4这个结构体的内存大小应该为最大对齐数(8)的整数倍
所以s4的内存字节大小为32,还得浪费1个字节。
结构体的对齐规则:
1. 第一个成员在与结构体变量偏移量为0的地址处。
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。
VS中默认的值为8
3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整
体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
为什么存在内存对齐?
大部分的参考资料都是如是说的:
1.平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特
定类型的数据,否则抛出硬件异常。
2.性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访
问。
总体来说:
结构体的内存对齐是拿空间来换取时间的做法。
那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:
让占用空间小的成员尽量集中在一起
结构体然后传参:
我们要将一个结构体传过去,有两种方式:
一种是将结构体类型传过去,一种是将结构体的地址传过去。
struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
直接先给结论:尽量结构体传参时,传结构体的地址!
原因:
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的
下降。
位段:
位段中的位,指得是二进制位(也就是比特位)
位段与结构体的同异点:
位段的声明和结构是类似的
有两个不同:
1.位段的成员必须是 int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字。
如何定义位段呢?如下:
位段的内存分配:
位段内存空间的计算规则:
1.位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
2.位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段
我们通过一个例子来了解一下位段的内存分配:
位段的跨平台问题:
1.位段包括unsigned int和signed int,是否有符号的这个问题没办法确定。(最高位是否为符号位)
2.位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机
器会出问题。
3.位段中,内存有低位向高位存储,还是有高位向低位存储不确定(没有确定是大端存储或者是小段存储)
4.当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是
舍弃剩余的位还是利用,这是不确定的。
位段和结构体对比时,位段可以很好的节省空间,而结构体不可以,但是位段存在明显的跨平台问题!!!
枚举类型:
枚举如何定义:
我们来介绍一下枚举:
它成员和成员之间是用逗号,而结构体用分号
RED,GREEN,BLUE叫做枚举的可能取值,而结构体的成员叫做成员变量
这里RED,GREEN,BLUE是有对应数字的,分别对应0,1,2
枚举的可能取值因为是枚举常量,所以不允许更改,但可以在一开始初始化。例如:RED=5;
枚举的优点:
我们可以使用 #define 定义常量,为什么非要使用枚举?
枚举的优点:
1. 增加代码的可读性和可维护性
2. 和#define定义的标识符比较枚举有类型检查,更加严谨。
3. 防止了命名污染(封装)
4. 便于调试5. 使用方便,一次可以定义多个常量
枚举的使用:
我们利用通讯录来了解一个枚举使用的好处:
我们正常会写一个函数(printf)来显示选择什么代表什什么,而我们运用枚举就可以避免这个问题,直接输入操作。
联合体(共用体):
联合体的定义:
跟结构体相同,没有什么区别:
联合体的每个变量共用同一个地址。
联合体的缺点:
但共用体有个缺点,如下图,不能同时使用c或b或者y,一次只能使用其中一个
联合体的内存大小:
联合的大小至少是最大成员的大小。
当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。