C语言----自定义结构


今天我们学习结构体,结构体是C语言非常重要的组成部分,是后续数据结构课程的基础(数据“结构”中的“结构”指的就是结构体)

一、结构体

结构体是你自己把一些数据(称为成员变量)以某种组织方式组织起来的一种自定义的数据类型

1.声明和自引用

结构体声明的抽象表示如下:
struct tag{
 	member-list;
 	
 }varible-list;
 

例如:一个学生

struct Stu{
int age;
char name[20];
int height;
char stu-number[8];//学号
} stu1,stu2;

这里表示一个学生结构体,包含年龄、姓名、身高、学号,并且定义了stu1和stu2两个变量

匿名定义:

struct {
int a;
char c;
long long d;
} x;

这就构造了一个匿名的结构体x,它没有标签

struct {
int a;
char c;
long long d;
} *px;

px=*x//这个写法是错误的,尽管这俩结构体成员一摸一样,但是还是两种不同的类型

匿名结构体类型类似于“一次性用品”,当以后再用它的时候,因为它没有标签,也无法再创建相同类型的变量。所以建议以后用不到的时候再定义这种结构体。(但是可以用typedef来为匿名结构体命名)

结构体还经常要用到自引用,试判断以下两个代码是否正确:

struct node{
int val;
struct node next;
};
typedef struct node{
int val;
Node* next;
}Node;

很遗憾,两个代码都是不对的。第一个代码中,struct node 里嵌套struct node,那么将会无限套娃,系统甚至无法判断该给struct node 多少空间,所以这个代码是错的
对于第二个代码,自引用时使用了指针,这本身没问题,但是使用typedef重命名结构体时,整个结构体创建完成之后才有Node这个名字,但是这段代码在创建的过程中就使用了Node,在逻辑上也说不通,正确方法是把结构体中第二个成员变量的类型改成struct node *

结构体赋值或初始化时,需要用大括号把各成员变量按顺序初始化:

typedef struct node {
int val;
struct node *next;
} Node;

Node a={7,NULL};//有一个int类型和一个struct node *类型

2.结构体的内存对齐(重点,面试常考)

这里先抛出几个问题,可以尝试着先算一算:

//练习1
struct S1
{
 char c1;
 int i;
 char c2;
};
printf("%d\n", sizeof(struct S1));
//练习2
struct S2
{
 char c1;
 char c2;
 int i;
};
printf("%d\n", sizeof(struct S2));
//练习3
struct S3
{
 double d;
 char c;
 int i;
};
printf("%d\n", sizeof(struct S3));
//练习4-结构体嵌套问题
struct S4
{
 char c1;
 struct S3 s3;
 double d;
};
printf("%d\n", sizeof(struct S4));

这些sizeof如何计算???
这就需要介绍关于结构体内存对齐的有关知识了
首先给出对齐规则:

  1. 第一个成员在与结构体变量偏移量为0的地址处。
  2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
    对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。

VS中默认的值为8 gcc下没有默认对齐数(对齐数就是成员自身大小)

  1. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
  2. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

意思就是说把这个结构体看成一个正常的成员变量(和其他数据类型一样)

如果在计算对齐数的时候遇到数组,可以把数组展开

不理解?那下面画个图来分析一下,如下图,对于S1,第一个成员是c1,放在起始处(0偏移),然后从i开始,默认对齐数为8,sizeof(int)=4,所以它的位置需要对齐到min(4,8)的整数倍,最近的就是4,所以i为4-7,同理,c2的对齐数是1,直接放下面,此时总大小为9,需要对齐为最大对齐数(4)的整数倍(12),所以下面再开三个空间,所以S1的大小为12
以此类推,S2大小为8
第一题图

//一个嵌套结构体的例子
struct S1
{
	double i;
	char ch;
	int x;
}
struct S2
{
	char c;
	struct S1 s;
	double x;
}
printf("%d",sizeof(struct S2));

1.S2里首先在0偏移处放c。
2.(S1请读者自己分析)s1里最大对齐为8,那么s2里在8的位置放S1,共16B,double对齐数为8,24处开始放,共8B,到31偏移处
3.此时S2大小32正好为最大对齐数(max(1,8,8))的整数倍。所以最终S2大小为32.

为什么存在内存对齐?

  1. 平台原因(移植原因):
    不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
  2. 性能原因:
    数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
    原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

总的来说,内存对齐是拿空间换时间的做法

所以在设计结构体时,为了既满足对齐,又节省空间,尽量做到:让占用空间小的成员尽量集中。

struct s1{
char c1;
int val;
char c2;
};
struct s2{
char c1;
char c2;
int val;
};
//s1和s2谁更占空间?

另外还可以在程序中修改默认对齐数

#pragma pack(n)//修改默认对齐数为n
#pragma pack()//还原对齐数为默认

再介绍一个宏offsetof,可以计算结构体中某变量的偏移值

offsetof(type,member)//需要包含头文件:<stddef.h>

读者可以自行实现这个宏的功能。

3.结构体传参

struct S
{
 int data[1000];
 int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
 printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
 printf("%d\n", ps->num);
}
int main()
{
 print1(s);  //传结构体
 print2(&s); //传地址
 return 0;
}//比较一下哪个更好

答案是第二种,也就是传址。
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
如果害怕传址会改变原结构体的值,那么就加一个const使得指针不能改变这个结构体的值

二、位段

位段和结构声明很相似,但是也有不同

1.定义

struct A
{
	int _a:2;
	int _b:5;
	int _c:10;
	int _d:30;
};

位段与结构的差别:
1.位段的成员必须是整型家族(int/char)
2.位段的成员名后面有一个冒号和一个数字

2.内存分配

那么1中定义位段的大小是多少呢?
(肯定不是4*4=16)

printf("%d\n",sizeof(struct A));

打印可得,结果为8.
位段的内存分配规则:
由于位段具有不确定性,不能跨平台,在每一个编译器下可能不同,这里只介绍VS下的位段:
先初始化一下:

s.a=3;
s.b=12;
s.c=3;
s.4=4;

在结构体声明和成员定义中给的值(2、5、10、30)表示变量所占的二进制位
位段
char类型的例子

3.跨平台和应用

位段的优缺点:
优点:相比于结构更节省空间;
缺点:1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
应用:网络协议报文

三、枚举

1.定义

顾名思义,枚举就是一一列举。

2.使用和优点

声明:

enum Day//星期
{
 Mon,
 Tues,
 Wed,
 Thur,
 Fri,
 Sat,
 Sun
};
enum Sex//性别
{
 MALE,
 FEMALE,
 SECRET
}enum Color//颜色
{
 RED,
 GREEN,
 BLUE
};

以上定义的 enum Day , enum Sex , enum Color 都是枚举类型。

{}中的内容是枚举类型的可能取值,也叫 枚举常量 。
需要说明的是:这些都是有值的,默认从0开始逐个加1,也可以初始化的时候赋值。如:

enum Color//颜色
{
 RED=1,
 GREEN=2,
 BLUE=4
};

当然也可以部分赋值,规则还是从上到下逐加一。

相比于直接用#define定义常量,使用枚举的优点:

  1. 增加代码的可读性和可维护性
  2. 和#define定义的标识符比较枚举有类型检查,更加严谨。
  3. 防止了命名污染(封装)
  4. 便于调试
  5. 使用方便,一次可以定义多个常量

使用

enum Color//颜色
{
 RED=1,
 GREEN=2,
 BLUE=4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值,才不会出现类型的差异。
clr = 5;               //ok??

四、联合体

1.定义

联合体又称为共用体,这种类型定义的变量也包含一系列的成员,其主要特征是这些成员公用同一块空间

//联合类型的声明
union Un//联合体用union关键字
{
 char c;
 int i;
};
//联合变量的定义
union Un un;
//计算联合体变量的大小
printf("%d\n", sizeof(un));

2.特点和计算

联合的成员共用同一块内存空间,因此一个联合变量的大小,至少是最大成员的大小(因为联
合至少得有能力保存最大的那个成员)。
也因为共用一块空间,联合体成员在使用的时候只能一次用一个成员,因为改一个成员可能会改变其他成员的值

union Un
{
 int i;
 char c;
};
union Un un;
// 下面输出的结果是一样的吗?
printf("%d\n", &(un.i));
printf("%d\n", &(un.c));
//下面输出的结果是什么?
un.i = 0x11223344;
un.c = 0x55;
printf("%x\n", un.i);//作者的计算机输出是11223355

这个程序还能用来判断当前计算机是大段存储还是小端存储。下面是图解
大小端判断
联合体成员大小:

union Un1
{
 char c[5];
 int i;
};
union Un2
{
 short c[7];
 int i;
};
//下面输出的结果是什么?
printf("%d\n", sizeof(union Un1));//8    5--->4*2=8
printf("%d\n", sizeof(union Un2));//16  14--->4*4=16

计算方法:
1.至少是最大成员大小
2.是最大对齐数的倍数

  • 15
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值