C语言：自定义类型——结构体与位段

最新推荐文章于 2024-07-11 23:38:50 发布

豆腐乾净找方规

最新推荐文章于 2024-07-11 23:38:50 发布

阅读量352

点赞数 3

文章标签： c语言蓝桥杯开发语言

本文链接：https://blog.csdn.net/m0_62976995/article/details/125348956

版权

1.8检验结构体成员偏移量函数——offsetof( )

1.结构体

1.1结构的基础知识

结构是一些值的集合，这些值称为成员变量。结构的每个成员可以是不同类型的变量。

1.2结构的声明

struct tag
{
    member-list;
}variable-list;

举例：如和描述一名学生

struct Student
{
	char name[20];
	int age;
	char sex[5];
	char id[20];
};//这里的分号不能丢弃

如何在结构体创建后直接创建结构体变量

struct Student
{
	char name[20];
	int age;
	char sex[5];
	char id[20];
}s1,s2,s3;//可以创建完结构体，直接在后面写变量名，创建结构体变量

如何在创建结构体全局变量和结构体局部变量

struct student
{
	char name[20];
	int age;
	char sex[5];
	char id[20];
};

struct student S1;//全局变量

int main()
{
	struct student S2;//局部变量
}

结构体指针和结构体数组的创建

struct student
{
	char name[10];
	int age;
	char sex[10];
	char school[10];
	char id[10];
}S1[10],*p;

int main()
{
	struct student S2[10];
	struct student* p2;
	return 0;
}

1.3特殊的声明

在声明结构的时候，可以不完全的声明。

比如：

在创建匿名结构体时，我们不会写结构体类型的类型名，因为在创建局部和全局结构体变量时需要结构体类型名，所以我们只能在结构体创建完后直接创建匿名结构体变量，这也是创建匿名结构体变量的唯一方法

匿名结构体数组和匿名结构体指针的创建

匿名结构体类型指针的问题

警告：

这里虽然两个匿名结构体成员是一模一样的，但是在编译器看来还是两个不同的类型的结构体。

所以是非法的。

1.4结构的自引用

在结构中包含一个类型为该结构本身的成员是否可以呢？
struct Node
{
	int data;
	struct Node next;
};
//可行否？
答案是肯定有问题，因为结构体套结构体，首先int data是4个字节，那下面那个结构体是多大呢，这又取决于这个结构体多大，这里成了一个套娃问题了，无法知道结构体到底多大，所以这里不是结构体嵌套，而是有问题的结构体创建
struct Node
{
 int data;
 struct Node* next;
};
这样一个存有自己类型指针的结构体是可以创建的，是因为指针就4/8个字节，结构体指针怎么创建内存大小，并且知道这个指针指向的是本结构体，就足够了，一般用于数据结构中链表.

结构体类型重命名
我们使用typedef可以重命名类型的名字，这样我们在结构体前面写上typedef，在结构体后写入重命名的名称，就可以即使用原本的类型名创建变量，又可以使用重命名后的类型名创建变量
typedef struct
{
	int data;
	Node* next;
}Node;
//这样写代码，可行否？
//解决方案：
typedef struct Node
{
	int data;
	struct Node* next;
}Node;
int main()
{
	Node p1;
	//and
	struct Node p2;
	return 0;
}

1.5结构体变量的定义和初始化

初始化有下面这两种
1.在创建完结构体后，直接创建变量然后初始化
2.在其他地方使用结构体类型创建变量后，进行初始化

struct Student
{
	char name[20];
	int age;
	char number[20];
}s1 = { "张三",20,"2000002" };//初始化：定义变量的同时赋初值。

int main()
{
	struct Student s2 = { "李四",30,"10000001" };//初始化：定义变量的同时赋初值。
}

结构体嵌套

struct student
{
	char name[10];
	char sex[10];
	char add[10];
	int age;
};
struct Class
{
	struct student s1;
	struct student s2;
	struct student s3;
};

这个是比较常用的结构体嵌套，先定义一个班级的结构体去嵌套学生的结构体，能够更好地表示。

1.6结构体内存对齐

我们已经掌握了结构体的基本使用了。

现在我们深入讨论一个问题：计算结构体的大小。

这也是一个特别热门的考点：结构体内存对齐

我们来探讨一下结构体的大小到底是多少
struct s1
{
	int a;
	char b;
	long c;
};

int main()
{
	printf("%d\n", sizeof(s1));
	return 0;
}
对于这个结构体来说是两个char类型成员变量和一个int类型成员变量组成的，我们一般认为这个结构体肯定是4+1+8个字节
但真是这么简单吗？

当我们打印出结构体占用的内存字节数时，你会发现并非如此，这个结构体竟然占用了12个字节，这是怎么计算的呢？

结构体内存对齐规律：
1. 第一个成员在与结构体变量偏移量为0的地址处。

2. 其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。VS中默认的值为8Linux没有默认对齐数（此时成员变量自身大小就是默认对齐数）

3. 结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。

4. 如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

也就是说结构体的内存占用规则是有要求的，我们根据上述要求，再来看一下刚刚的结构体

计算结构体大小过程：

根据1. 第一个成员在与结构体变量偏移量为0的地址处得知我们要在结构体首地址处就开始放入第一个成员，第一个成员为int类型，占四个字节

第二个成员是char型，根据2. 其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处得知，第二个成员要计算机对齐数然后再对齐，vs中的结构体默认对齐数为8，而int型的大小是1，取两者中较小的值作为本成员的对齐数，结果为1，所以char型的i应该从偏移量为4的位置开始向下存入1个字节

第三个成员变量是long型，和默认对齐数相比，4应该为较小值，所以第三个成员变量的对齐数应该是4，这样应该从偏移量为5的位置开始向下存入4个字节

我们算完成员变量的在内存中布局后，还要根据3. 结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍再去修整结构体最后的内存大小，因为总大小为每个成员变量中对齐数的最大值，我们知道a的对齐数是4，b的对齐数是1，c的对齐数是4，得出结构体的对齐数是4，但现在我们虽然偏移到8，但实际占了9个字节，因为9不是4的倍数，所以下一个4的倍数为12，就得出了结构体的总大小为12个字节

对于结构体镶嵌后的结构体的大小：
struct s1
{
	int a;
	char b;
	long c;
};
struct s2
{
	int a;
	char b;
	struct s1 s;
};

int main()
{
	printf("s1:%d\n", sizeof(s1));
	printf("s2:%d\n", sizeof(s2));
	return 0;
}
让我们再去分析一下：

我们首先来看结构体存放在结构体的内存布局问题，4. 如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍

首先你要知道嵌套的结构体中的最大对齐数，他的最大对齐数应该是8个字节，因为该结构体包括了一个int一个char在这个结构体中最大对齐数是由s1提供的为8，结构体8字节再和结构体默认对齐数对比，最后为8，所以s3这个结构体应该在偏移量为8的位置存下自己

最后来看结构体整体大小，结构体的整体大小是所有最大对齐数的整数倍，也就是所有成员变量，包括结构体s3中成员变量中最大的对齐数的整数倍，这里还是由s1提供的8字节最大，所以最后为20

考点

如何计算？

首先得掌握结构体的对齐规则：

1. 第一个成员在与结构体变量偏移量为0的地址处。

2. 其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。 对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。VS中默认的值为8

3. 结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。

4. 如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

1.7 修改默认对齐数

#pragma 这个预处理指令，这里我们再次使用，可以改变我们的默认对齐数

#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认
int main()
{
	//输出的结果是什么？
	printf("%d\n", sizeof(struct S1));
	printf("%d\n", sizeof(struct S2));
	return 0;
}

我们就看看这个默认对其数为1的代码

我们可以看到：

1.char的对齐数为1等于默认对齐数，所以从0开始占一个位

2.int的对齐数为4大于默认对齐数，即从1-4

3.第二个char同第一个一样

4.默认对齐数为1所以任何书皆可，我们就可以知道对齐数为6

1.8检验结构体成员偏移量函数——offsetof( )

size_t offsetof( structName, memberName );

功能：输入结构体和结构体的成员，返回成功在该结构体中的偏移量

头文件:<stddef.h>

1.9为什么存在内存对齐

1. 平台原因(移植原因，结构体允许跨平台移植)：
不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
2. 性能原因：
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。

举例说明一下 2.性能原因
当我们想去读取int类型的i时你会发现，如果不考虑对齐数，想拿到i你需要读取两次才能成功拿到，而有了对齐数，可以一次就拿到int类型的i虽然浪费了空间，但是可以提升计算机的速度和效率

总体来说：结构体的内存对齐是拿空间来换取时间的做法。

1.10结构体内存对齐优化

这个两个结构体，都是由两个char类型，一个int型组成，根据上面的对齐规则，右边的结构体比左边的结构体占内存空间小很多

结论：
那在设计结构体的时候，我们既要满足对齐，又要节省空间，应该：让占用空间小的成员尽量集中在一起。

1.11结构体传参

struct S
{
	int data[1000];
	int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
	printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
	printf("%d\n", ps->num);
}
int main()
{
	print1(s); //传结构体
	print2(&s); //传地址
	return 0;
}

2.位段

2.1 什么是位段

位段的声明和结构是类似的，有两个不同：
1.位段的成员必须是int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字。

struct A
{
	int _a:2;
	int _b:5;
	int _c:10;
	int _d:30;
};

2.2位段的内存分配

1. 位段的成员可以是int unsigned int signed int 或者是char （属于整形家族）类型。

2. 位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。

3. 位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

这里一上来就是创建的int型，所以一下创建了32个字节，然后挨个放入a，b，c，当放下d为30bit时就放不进去这个int类型了，所以再去新建一个int型，放入d，这个存储方式可能仅限于vs编译器所以打印出来应该是8个字节，也就是两个int型的大小

位段的问题
由于位段不跨平台，注重可移植性的程序应该避免使用位段，所以它的内存布局问题，一般取决于编译器例如，我们遇到d时，会存在放不下的问题，但是到底是新创建个int型去存储d，还是利用刚刚剩余的空间先存储一部分d再去创建int型创建d，这个我们不得而知还有个问题就是，到底是从右向左存储还是从左向右存储这些问题都取决于编译器

我们来验证一下vs下位段的内存布局是否和我们设想的一样呢，结果发现完全吻合

2.3位段的跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的。

2. 位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题）

3. 位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义（大小端问题）。

4. 当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。

总结：
跟结构相比，位段可以达到同样的效果，但是可以很好的节省空间，但是有跨平台的问题存在。

2.4位段的应用

ip数据包利用位段，减少了不必要的空间浪费

豆腐乾净找方规

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
1
评论
C语言：自定义类型——结构体与位段

目录1.结构体1.1结构的基础知识1.2结构的声明 1.3特殊的声明1.4结构的自引用1.5结构体变量的定义和初始化1.6结构体内存对齐1.7 修改默认对齐数1.8检验结构体成员偏移量函数——offsetof( )1.9为什么存在内存对齐1.10结构体内存对齐优化1.11结构体传参 2.位段2.1 什么是位段 2.2位段的内存分配2.3位段的跨平台问题 2.4位段的应用...
复制链接

扫一扫