C语言:自定义类型——结构体与位段

目录

1.结构体

1.1结构的基础知识

1.2结构的声明 

1.3特殊的声明

1.4结构的自引用

1.5结构体变量的定义和初始化

1.6结构体内存对齐

1.7 修改默认对齐数

1.8检验结构体成员偏移量函数——offsetof( )

1.9为什么存在内存对齐

1.10结构体内存对齐优化

1.11结构体传参

 2.位段

2.1 什么是位段 

2.2位段的内存分配

2.3位段的跨平台问题 

2.4位段的应用


1.结构体

1.1结构的基础知识

结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。 

1.2结构的声明 

struct tag
{
    member-list;
}variable-list;

 举例:如和描述一名学生

struct Student
{
	char name[20];
	int age;
	char sex[5];
	char id[20];
};//这里的分号不能丢弃

如何在结构体创建后直接创建结构体变量

struct Student
{
	char name[20];
	int age;
	char sex[5];
	char id[20];
}s1,s2,s3;//可以创建完结构体,直接在后面写变量名,创建结构体变量

如何在创建结构体全局变量和结构体局部变量

struct student
{
	char name[20];
	int age;
	char sex[5];
	char id[20];
};

struct student S1;//全局变量

int main()
{
	struct student S2;//局部变量
}

结构体指针和结构体数组的创建

struct student
{
	char name[10];
	int age;
	char sex[10];
	char school[10];
	char id[10];
}S1[10],*p;

int main()
{
	struct student S2[10];
	struct student* p2;
	return 0;
}

1.3特殊的声明

在声明结构的时候,可以不完全的声明。
比如:

在创建匿名结构体时,我们不会写结构体类型的类型名,因为在创建局部和全局结构体变量时需要结构体类型名,所以我们只能在结构体创建完后直接创建匿名结构体变量,这也是创建匿名结构体变量的唯一方法 

匿名结构体数组和匿名结构体指针的创建

匿名结构体类型指针的问题

警告:
这里虽然两个匿名结构体成员是一模一样的,但是在编译器看来还是两个不同的类型的结构体
所以是 非法 。 

1.4结构的自引用

在结构中包含一个类型为该结构本身的成员是否可以呢?
struct Node
{
	int data;
	struct Node next;
};
//可行否?

 答案是肯定有问题,因为结构体套结构体,首先int data是4个字节,那下面那个结构体是多大呢,这又取决于这个结构体多大,这里成了一个套娃问题了,无法知道结构体到底多大,所以这里不是结构体嵌套,而是有问题的结构体创建

struct Node
{
 int data;
 struct Node* next;
};

这样一个存有自己类型指针的结构体是可以创建的,是因为指针就4/8个字节,结构体指针怎么创建内存大小,并且知道这个指针指向的是本结构体,就足够了,一般用于数据结构中链表.

结构体类型重命名
我们使用typedef可以重命名类型的名字,这样我们在结构体前面写上typedef,在结构体后写入重命名的名称,就可以即使用原本的类型名创建变量,又可以使用重命名后的类型名创建变量

typedef struct
{
	int data;
	Node* next;
}Node;
//这样写代码,可行否?
//解决方案:
typedef struct Node
{
	int data;
	struct Node* next;
}Node;
int main()
{
	Node p1;
	//and
	struct Node p2;
	return 0;
}

1.5结构体变量的定义和初始化

初始化有下面这两种
1.在创建完结构体后,直接创建变量然后初始化
2.在其他地方使用结构体类型创建变量后,进行初始化

struct Student
{
	char name[20];
	int age;
	char number[20];
}s1 = { "张三",20,"2000002" };//初始化:定义变量的同时赋初值。

int main()
{
	struct Student s2 = { "李四",30,"10000001" };//初始化:定义变量的同时赋初值。
}

结构体嵌套

struct student
{
	char name[10];
	char sex[10];
	char add[10];
	int age;
};
struct Class
{
	struct student s1;
	struct student s2;
	struct student s3;
};

这个是比较常用的结构体嵌套,先定义一个班级的结构体去嵌套学生的结构体,能够更好地表示。

1.6结构体内存对齐

我们已经掌握了结构体的基本使用了。
现在我们深入讨论一个问题:计算结构体的大小。
这也是一个特别热门的考点: 结构体内存对齐

我们来探讨一下结构体的大小到底是多少

struct s1
{
	int a;
	char b;
	long c;
};

int main()
{
	printf("%d\n", sizeof(s1));
	return 0;
}

对于这个结构体来说是两个char类型成员变量和一个int类型成员变量组成的,我们一般认为这个结构体肯定是4+1+8个字节
但真是这么简单吗?

当我们打印出结构体占用的内存字节数时,你会发现并非如此,这个结构体竟然占用了12个字节,这是怎么计算的呢? 

结构体内存对齐规律:
1. 第一个成员在与结构体变量偏移量为0的地址处。


2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。VS中默认的值为8Linux没有默认对齐数(此时成员变量自身大小就是默认对齐数)


3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。


4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

 也就是说结构体的内存占用规则是有要求的,我们根据上述要求,再来看一下刚刚的结构体

计算结构体大小过程:


根据1. 第一个成员在与结构体变量偏移量为0的地址处得知我们要在结构体首地址处就开始放入第一个成员,第一个成员为int类型,占四个字节


第二个成员是char型,根据2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处得知,第二个成员要计算机对齐数然后再对齐,vs中的结构体默认对齐数为8,而int型的大小是1,取两者中较小的值作为本成员的对齐数,结果为1,所以char型的i应该从偏移量为4的位置开始向下存入1个字节


第三个成员变量是long型,和默认对齐数相比,4应该为较小值,所以第三个成员变量的对齐数应该是4,这样应该从偏移量为5的位置开始向下存入4个字节


我们算完成员变量的在内存中布局后,还要根据3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍再去修整结构体最后的内存大小,因为总大小为每个成员变量中对齐数的最大值,我们知道a的对齐数是4,b的对齐数是1,c的对齐数是4,得出结构体的对齐数是4,但现在我们虽然偏移到8,但实际占了9个字节,因为9不是4的倍数,所以下一个4的倍数为12,就得出了结构体的总大小为12个字节

 对于结构体镶嵌后的结构体的大小:

struct s1
{
	int a;
	char b;
	long c;
};
struct s2
{
	int a;
	char b;
	struct s1 s;
};

int main()
{
	printf("s1:%d\n", sizeof(s1));
	printf("s2:%d\n", sizeof(s2));
	return 0;
}

让我们再去分析一下:

 

我们首先来看结构体存放在结构体的内存布局问题,4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍


首先你要知道嵌套的结构体中的最大对齐数,他的最大对齐数应该是8个字节,因为该结构体包括了一个int一个char在这个结构体中最大对齐数是由s1提供的为8,结构体8字节再和结构体默认对齐数对比,最后为8,所以s3这个结构体应该在偏移量为8的位置存下自己


最后来看结构体整体大小,结构体的整体大小是所有最大对齐数的整数倍,也就是所有成员变量,包括结构体s3中成员变量中最大的对齐数的整数倍,这里还是由s1提供的8字节最大,所以最后为20
 

考点
如何计算
首先得掌握结构体的对齐规则:
1. 第一个成员在与结构体变量偏移量为0的地址处。
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。 对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。VS中默认的值为8
3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

1.7 修改默认对齐数

#pragma 这个预处理指令,这里我们再次使用,可以改变我们的默认对齐数
#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
	//输出的结果是什么?
	printf("%d\n", sizeof(struct S1));
	printf("%d\n", sizeof(struct S2));
	return 0;
}

我们就看看这个默认对其数为1的代码

我们可以看到:

1.char的对齐数为1等于默认对齐数,所以从0开始占一个位

2.int的对齐数为4大于默认对齐数 ,即从1-4

3.第二个char同第一个一样

4.默认对齐数为1所以任何书皆可,我们就可以知道对齐数为6

1.8检验结构体成员偏移量函数——offsetof( )

size_t offsetof( structName, memberName );

功能:输入结构体和结构体的成员,返回成功在该结构体中的偏移量

头文件:<stddef.h>

 

1.9为什么存在内存对齐

1. 平台原因(移植原因,结构体允许跨平台移植):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2. 性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

举例说明一下 2.性能原因
当我们想去读取int类型的i时你会发现,如果不考虑对齐数,想拿到i你需要读取两次才能成功拿到,而有了对齐数,可以一次就拿到int类型的i虽然浪费了空间,但是可以提升计算机的速度和效率

 总体来说:结构体的内存对齐是拿空间来换取时间的做法。

1.10结构体内存对齐优化

这个两个结构体,都是由两个char类型,一个int型组成,根据上面的对齐规则,右边的结构体比左边的结构体占内存空间小很多

 

结论:
那在设计结构体的时候,我们既要满足对齐,又要节省空间,应该:让占用空间小的成员尽量集中在一起。

1.11结构体传参

struct S
{
	int data[1000];
	int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
	printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
	printf("%d\n", ps->num);
}
int main()
{
	print1(s); //传结构体
	print2(&s); //传地址
	return 0;
}

 2.位段

2.1 什么是位段 

位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字。

struct A
{
	int _a:2;
	int _b:5;
	int _c:10;
	int _d:30;
};

2.2位段的内存分配

1. 位段的成员可以是int unsigned int signed int 或者是char (属于整形家族)类型。


2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。


3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

 这里一上来就是创建的int型,所以一下创建了32个字节,然后挨个放入a,b,c,当放下d为30bit时就放不进去这个int类型了,所以再去新建一个int型,放入d,这个存储方式可能仅限于vs编译器所以打印出来应该是8个字节,也就是两个int型的大小

 

 位段的问题
由于位段不跨平台,注重可移植性的程序应该避免使用位段,所以它的内存布局问题,一般取决于编译器例如,我们遇到d时,会存在放不下的问题,但是到底是新创建个int型去存储d,还是利用刚刚剩余的空间先存储一部分d再去创建int型创建d,这个我们不得而知还有个问题就是,到底是从右向左存储还是从左向右存储这些问题都取决于编译器

我们来验证一下vs下位段的内存布局是否和我们设想的一样呢,结果发现完全吻合

 

2.3位段的跨平台问题 

1. int 位段被当成有符号数还是无符号数是不确定的。


2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题)


3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义(大小端问题)。


4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。

总结:
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。

2.4位段的应用

 ip数据包利用位段,减少了不必要的空间浪费

 

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

豆腐乾净找方规

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值