在C语言中,除了基本的内置数据类型(如int、float、char等)之外,还有一种非常有用的特性——自定义类型。自定义类型允许我们根据实际需求,创建具有特定功能和属性的复合数据类型。通过自定义类型,我们可以更好地组织和管理复杂的数据结构,提高代码的可读性和可维护性。
本文将介绍C语言中的自定义类型,包括结构体(struct)、联合体(union)、枚举(enum)和typedef关键字。我们将通过具体的示例,展示如何使用这些自定义类型来简化编程任务,提高代码的灵活性和可扩展性。希望本文都会对您有所帮助。让我们开始探索C语言中的自定义类型吧!
结构体
结构体(struct)是C语言中的一种自定义数据类型,它允许我们将多个不同类型的数据项组合成一个单一的复合类型。这种数据结构非常类似于现实世界中的物体,例如一个人可以有姓名、年龄和身高等信息,这些信息共同构成了一个人的完整描述。在C语言中,我们可以使用结构体来表示这样的实体。
结构体的声明
结构的基础
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
声明的结构
struct tag// 关键字 结构体名字
{
member-list;//成员列表
}variable-list;//变量列表
例如,我们可以定义一个名为bookk
的结构体来存储书籍的相关信息:
struct Book {
char title[50];
char author[50];
int id;
float price;
};
结构体变量的初始化
那么,我们同样依据对book的结构体,来初始化一个结构体变量
依据其默认顺序来进行初始化:
int main()
{
struct Book s1= {"C语言教程","zhangsan",1234,65.00};
}
or指定顺序对其进行初始化:
struct Book s2={.title="C语言教程",.author="zhangsan",.id=1234,.price=65.00};
结构体的特殊声明
在声明结构体时,也存在一些特殊情况:
//匿名结构体
struct
{
int a;
char b;
float c;
}x;
特殊的声明,省略结构体标签,导致只可以使用一次,当然,对这个声明进行重命名(typedef)也可以继续使用。
结构体的自引用
结构体自引用是C语言中的一种特殊设计,允许结构体类型的一个实例包含指向相同结构体类型的指针。这种设计通常用于实现复杂的数据结构,如链表、树、图等,其中每个节点可能需要引用其他节点。
struct Node
{
int data;
struct Node next;
};
这样可行吗???
这种自引用方式是不可行的,当我们试计算sizeof(struct Node next)我们将会发现,这个自引用将会使这个结构体陷入死循环,我们想要寻找同一类型的下一个节点,只需调用地址(指针域)即可
以下是正确的自引用方式
struct Node
{
int data;
struct Node* next;
};
当我们在使用重名方式时,也容易出错:
typrdef struct
{
int data;
Node* next;
}Node;
这样的自引用方式可行吗?同样是不能的,Node是在匿名结构体的重命名产生的,但是在匿名结构体内部提前使用了Node类型来创建成员变量,这是不可行的。
正确自引用方式如下:
typedef struct Node
{
int data;
struct Node* next;
}Node;
结构体内存对齐
结构体内存对齐是指结构体在内存中的存储方式,其目的是为了提高数据访问速度。在计算机系统中,CPU访问内存时,通常以字节为单位进行读写操作。为了提高数据访问速度,编译器会将结构体中的成员变量按照一定的规则进行对齐,使其地址能够满足CPU的访问要求。(以空间换时间)
结构体对齐规则
1. 第一个成员在与结构体变量偏移量为0的地址处。
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。
(VS中默认的值为8 Linux中没有默认对齐数,对齐数就是成员自身的大小)
3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
结构体对齐举例
如果直接按照大小计算,那么sizeof(S1)大小应该是6,但是最终在电脑内存中显示是占用了12,在这个结构体中,发生了内存对齐;
对于第一个char类型的数据,它相对于起始位置的偏移量为0,但第二个是int数据的存贮,int大小为4,默认对齐数为8,二者之间选择最小的,那么int就在相对偏移量4的位置;再存储第三个数据—char类型存储,但结构体总大小为最大对齐数,所以需要cahr在偏移量12的地方,满足所有对齐规则,其余空间全部是浪费掉了。
为什么会存在结构体对齐
1. 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2. 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
3.网络和存储协议:在某些情况下,网络协议或存储格式要求数据以特定的方式对齐。结构体对齐可以确保数据在传输或存储时符合这些协议的要求。
4.兼容性:不同的硬件平台可能对数据对齐有不同的要求。通过结构体对齐,编译器可以为不同的平台生成兼容的代码,确保程序在不同的硬件上都能正确运行。
总体来说: 结构体的内存对齐是拿空间来换取时间的做法。
修改对齐数
#pragma 这个预处理指令,可以改变默认对齐数
#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
printf("%d\n", sizeof(struct S1));
}
结果如下:
结构体传参
struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
如上图所示,结构体传参可以传递结构体变量本身和传递地址都是结构体传参的方式。若要传参:参数可以选择传地址 。
原因: 函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。 如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
结构体实现位段
什么是位段
位段(Bit field)是一种在编程语言中允许程序员以位为单位来指定数据的存储方式和长度的结构。它通常用于在数据结构中对空间进行优化,尤其是当需要处理只有几个位的数据字段时,比如在嵌入式编程中。
在C语言中,位段的定义是通过结构体(struct
)来实现的,允许你为结构体的成员指定具体的位数。
1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
struct A
{
int _a:2;//所占多少比特位
int _b:5;//所占多少比特位
int _c:10;//所占多少比特位
int _d:30;//所占多少比特位
};
以上代码便是结构体位段的示例,执行的结果为:
比起4个int类型在结构体中所占的16个字节,这个使用的了8个字节:(2+5+10+30=47比特位,int大小为4个字节,32个比特位,则所占用大小为8个字节)。
通过计算我们也知道,实际上这个结构体位段后仍然存在空间多余的情况,剩下的比特位会不会被使用呢?C语言中标准没有规定,是取决编译器(解释了为什么位段不跨平台)
vs上如何给位段开辟空间
struct S
{ char a : 3;
char b : 4;
char c : 5;
char d : 4; };
int main()
{
struct S s = { 0 };
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
printf("%d", sizeof(struct S));
}
以这段代码为例子,我们来看看内存中是如何存储的:
其实,总结就是从每一字节的右往左使用,如果剩余空间不够下一个成员使用,则会浪费这个字节的剩余空间。(仅仅只适用于vs)
位段的跨平台问题
1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,若写成30等比特位,在16位机
器会出问题。
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
位段的使用
网络协议中,IP数据的格式,我们看到其中很多的属性只需要几个比特位就可以描述,这里使用了位段,能够实现想要的效果,也节省了空间,对传输数据也是有帮助。
联合体
联合体(Union)在C语言中是一种特殊的数据类型,它允许在相同的内存位置存储不同的数据类型。联合体中的所有成员共享同一块内存空间(又称作共同体),因此联合体的大小是其最大成员的大小。联合体的大小必须足够大以容纳其所有成员中最大的那个。
定义的语法如下:
union 联合体名 {
类型1 成员1;
类型2 成员2;
...
类型n 成员n;
};
联合体的声明
我们在这里声明一个联合体,在这里查看联合体的内存使用情况:
union u
{
char c;
int u;
};
int main()
{
union u uu;
printf("%zd\n", sizeof(uu));
printf("%p\n", &uu);
printf("%p\n", &(uu.c));
printf("%p\n", &(uu.u));
}
结果如下:
我们通过地址知道,联合体中的成员共用这一块内存空间,且空间内存大小为类型最大成员的大小。这样的内存空间大小也决定了联合体中同一时间只有一个成员可以使用。
联合体的大小
联合的大小至少是最大成员的大小。 当当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
联合体同样存在对齐!!!
union s
{
char c[6];
int u;
};
int main()
{
printf("%zd", sizeof(union s));
}
上面的代码,按照对联合体的直接理解,他的所占空间大小是不是6呢?我们看看下面的结果:
char c这个数组的大小是6,而vs的默认对齐数是8,所以还要浪费两个空间,实际大小是8个字节,我们在计算联合体的大小时,不要忘记是否存在内存对齐的情况!!!
联合体的使用
假如,我们要进行一个活动,上线一个礼品兑换单,兑换单有三种商品:图书,杯子,衬衫
每一种商品都有库存量,价格,商品类型相关的其他信息:
图书: 书名 作者 杯子: 设计 衬衫: 设计 可选颜色 可选尺码
以上就是关于礼品兑换单的描述,那么可能会有人直接写下一下结构:
struct gift_list
{
//公共属性
int stock_number;//库存量
double price;//定价
int item_type;//商品类型
char title[20];//书名
char author[20];//作者
char design[30];//设计
int colors;//颜色
int sizes;//尺寸
};
用纯粹的结构体实现了整个目的,但是,不同的商品兑换,有这各自的特殊属性,用不上的属性便会造成浪费,所以,我们在这里可以使用联合体:
union {
struct
{
char title[20];//书名
char author[20];//作者
}book;
struct
{
char design[30];//设计
}mug;
struct
{
char design[30];//设计
int color;//颜色
int sizes;//尺寸
}shirt;
}item;
};
所以我们将把公共属性单位单独写出来,剩余属于各种商品本身的属性使用联合体起来,这样就可以介绍所需的内存空间,一定程度上节省了内存。
判断机器是大端还是小端
union U
{
int n ;
struct S
{
char s1;
char s2;
char s3;
char s4;
}s;
};
int main()
{
union U u = { 0 };
u.n = 0x11223344;
printf("%x %x %x %x\n", u.s.s1, u.s.s2, u.s.s3, u.s.s4);
}
执行的结果如下:
枚举
枚举(enum
)是一种用户定义的数据类型,允许用户定义一组命名的整数常量。枚举类型非常有用,当程序中的某个变量只能取一个有限的几个值时,使用枚举可以使得代码更加清晰、易于理解和维护。
定义 方式如下:
enum 枚举名 {
枚举元素1,
枚举元素2,
...
枚举元素n
};
而下面是一个例子:
enum Weekday {
MONDAY = 1,
TUESDAY = 2,
WEDNESDAY = 3,
THURSDAY = 4,
FRIDAY = 5,
SATURDAY = 6,
SUNDAY = 7
};