下面列举几种C语言中常用的自定义数据类型:
1. 结构体类型
当描述一个整型变量时,可以用int,描述字符型变量时,可以用char,但要描述一个学生时,因为这个学生包含的信息很多,比如姓名,性别,年龄等,不能通过单一的类型来描述,所以,这里引入结构体类型,将某个事物的共有属性集合在一起,声明一个结构体类型来描述该事物。
1)结构体类型的声明,格式如下:
struct tag //结构体类型名
{
member_list;//结构体成员列表
};
注意:
(1)声明结构体类型时,必须用关键字struct,这里的tag可以省略,但最好不要省略
(2)这里只是声明了结构体类型,实际并不占用内存,只有定义了结构体变量,才占用内存
(3)结构体每个成员可以是相同或不同的类型的变量,但必须至少有一个成员变量。
例如:描述一个学生
struct Student
{
char name[20];//姓名
char sex;//性别
int age;//年龄
int num;//学号
};//注意,这里的分号不能丢
2)结构体的自引用
如果一个结构体类型中的成员变量的类型是该结构体类型,这样做是否可以呢?如:
struct Student
{
int num;
struct Student s;
};
如果这样声明,那么该结构体类型定义的变量大小又是多少呢,是不确定的,所以,这样声明是错误的。
正确的自引用方式:
struct Student
{
int num;
struct Student *s;//注意这里的结构体类型名必须加struct
};
不论是什么类型的指针,在32位平台上所占的均是4字节,64位平台上均是8字节,这样,结构体变量的大小就可以确定了。
3)结构体的不完整声明
struct A
{
struct B b;
int i;
};
struct B
{
struct A a;
int j;
};
这样写是否可以呢,结构体struct B的定义在结构体struct A的下面,所以不可以这样写。那么,将两个结构体类型声明的位置互换一下呢,也是不可以的,这样,结构体struct A的定义就在结构体struct B的下面,正确的方式如下:
struct B;
struct A
{
struct B b;
int i;
};
struct B
{
struct A a;
int j;
};
当结构体的定义在结构体的使用下面时,应当提前声明,这样,才会避免错误。
注意:当结构体互相包含时,应当使用结构体的不完全声明。
4)结构体变量的定义和初始化
例如,根据上述的结构体定义结构体变量可以有下述几种方法:
(1)结构体声明的同时定义变量
struct Student
{
char name[20];//姓名
char sex;//性别
int age;//年龄
int num;//学号
}s={"zhangsan",'w',20,111};
(2)声明结构体后再定义变量
struct Student
{
char name[20];//姓名
char sex;//性别
int age;//年龄
int num;//学号
};
struct Student s={"zhangsan",'w',20,111};
(3)匿名结构体类型定义变量
struct
{
char name[20];//姓名
char sex;//性别
int age;//年龄
int num;//学号
}s={"zhangsan",'w',20,111};
这种方法也是可以的,但最好不要这样做,如:
struct
{
char name[20];//姓名
char sex;//性别
int age;//年龄
int num;//学号
}s;
struct
{
char name[20];//姓名
char sex;//性别
int age;//年龄
int num;//学号
}*ps;
如果进行操作:ps=&s;
这样是不可以的,编译器会将上述两个结构体当做不同类型的结构体,所以会发生错误。
注意:结构体初始化与数组相同,都必须整体进行赋值。
5)结构体成员的访问
结构体成员的访问有下述两种方法:一是通过结构体变量进行访问,二是通过结构体指针进行访问。
struct Student
{
char name[20];//姓名
char sex;//性别
int age;//年龄
int num;//学号
}ps;
struct Student s={"zhangsan",'w',20,111};
ps=&s;
(1)通过结构体变量进行访问:
printf("%s\n",s.name);
(2)通过结构体指针进行访问:
printf("%s\n",ps->name);
这两种方法达到的效果都是相同的。
6)结构体内存对齐(重要)
先看下面两个例子:
struct A
{
char a;
int b;
char c;
};
struct B
{
char a;
char c;
int b;
};
结构体A的所占内存为:12字节。结构体B所占内存为:8字节。
两个结构体的成员构成完全相同,除了顺序不同,为什么所占的内存不同呢?这里,就涉及到结构体的内存对齐问题:
结构体内存对齐规则:
(1)结构体第一个成员变量始终在偏移量为0的地址处
(2)其他结构体成员变量的偏移量在对齐数的整数倍处。对齐数:编译器默认的对齐数与自身类型所占大小的最小值,VS默认为8,Linux默认为4。
(3)结构体的最大小必须是最大对齐数的整数倍
(4)如果嵌套了结构体,嵌套的结构体的对齐数即为自己的最大对齐数。
通过以上规则,我们就可以明白上述两个结果为什么不同了。在结构体A中,第一个成员变量偏移量为0,占1个字节,第二个成员变量,对齐数为4,占4个字节,所以从偏移量为4处开始放置4个字节,第三个成员对齐数为1,占一个字节,所以从偏移量为8处开始放置1个字节,此时,共占用了9个字节,但考虑到规则(3),最大对齐数为4,所以共占用12个字节。结构体B可用相同的方法考虑得到。
注意:结构体内存对齐是拿空间来换取时间
7)结构体传参
结构体传参与数组相同,统一传送结构体指针。
2. 位段
位段的声明与结构体是类似的,只有两点不同:
(1)位段的成员必须是整型或字符型
(2)位段的成员名后面有一个冒号和一个数字
如:
struct A
{
int a:2;
int b:10;
int c:25;
};
位段A的所占内存是多少呢?
首先,a是int型的,会开辟32个比特位,而变量a只占用2个比特位,然后,变量b紧接着a占用10个比特位,此时还剩余20个比特位,而变量c需要25个比特位,而剩余的20个比特位不够容纳,所以会在开辟一个整型的大小,来存放变量c的25个比特位,所以,该位段共占用8个字节。
注意:位段与结构体相比,可以节省时间,但是跨平台型比较差。
3. 枚举类型
枚举类型就是可以将其成员一一列举出来的,比如一周的7天,可以从周一到周天一一列举出来。
1)枚举类型的定义
enum Weekday
{
Mon,
Tues,
Wed,
Thur,
Fri,
Sat,
Sun
};
注意:
(1)枚举类型的声明必须使用关键字enum
(2)除最后一个枚举成员无符号外,其余用逗号分隔
(3)枚举成员都是有值的,默认从0开始,也可以赋初值,之后的成员从初值开始往后依次加1。所以,枚举成员也被称为枚举常量
2)枚举变量的定义和赋值
枚举变量的定义与结构体类似,但赋值时只能用枚举常量进行赋值。
4)联合(共用体)类型
共用体的特点是各个成员共用一块内存空间
1)联合类型声明
union U
{
int i;
char c;
};
因为联合体成员变量共用一块内存,所以该联合体类型所占的内存为4字节。
2)共用体变量的定义及使用
union U
{
int i;
char c;
}un;
此时,&(un.c)和&(un.i)的结果是相同的。
注意:联合体内所有成员的地址和联合体变量的地址在数值上是相同的。
因此,可以用共用体类型判断计算机的大小端问题。
3)共用体大小的计算
共用体也需要考虑内存对齐问题:
(1)共用体的大小至少是最大成员的大小
(2)当最大成员的大小不是最大对齐数的整数倍时,共用体的大小要是最大对齐数的整数倍。