结构体的介绍

ly@눈_눈

已于 2022-10-02 09:06:00 修改

阅读量364

点赞数 8

分类专栏： c及c++笔记文章标签： c语言

于 2022-09-25 21:56:29 首次发布

本文链接：https://blog.csdn.net/weixin_68278653/article/details/126962653

版权

c及c++笔记专栏收录该内容

18 篇文章 0 订阅

订阅专栏

文章目录

1.结构体
2.位段

前言，之前我们学到过整数用int来表示，字符用char表示，那么如何表示一个人，一本书，一座山等等？这时就引入了结构体的概念。

1.结构体

1.1结构体的概念

结构是一些值的集合，这些值称为成员变量，这些成员变量就构成了结构体。结构的每个成员可以是不同类型的变量。

1.2结构体的声明

struct tag
{
member-list;
}variable-list;

tag是结构体的标签，相当于你定义他的名字；member-list是成员变量；variable-list声明变量，这里声明的是全局变量。
例如描述一个学生：

struct Stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
}; //分号不能丢

在声明结构的时候，可以不完全的声明。下面的两个结构在声明的时候省略掉了结构体标签（tag）。

//匿名结构体类型
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}a[20], *p;

//在上面代码的基础上，下面的代码合法吗？
p = &x;
两个匿名结构体，编译器会把上面的两个声明当成完全不同的两个类型，所以是非法的。

1.3结构体的自引用

在结构中包含一个类型为该结构本身的成员是否可以呢？
例如：struct Node
{
int data;
struct Node next;
};
这样写的话，sizeof(struct Node)是多少？结构体里面有一个数据和结构体，这样会无限套娃下去，所以这样写编译器就会报错，正确的自引用方式：
struct Node
{
int data;
struct Node* next;
};
这样调用的是同类型的下一个结点的地址。(数据域和指针域)
结点:数据元素的内容及直接后继的存储地址组成数据元素的存储结构,称为一个结点; 结点的数据域:用于保存数据元素信息的部分; 结点的指针域:用于保存数据元素直接后继存储地址的部分

1.4结构体变量的定义和初始化

> struct Point
{
 int x;
 int y; 
 }p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2

//初始化：定义变量的同时赋初值。
struct Point p3 = {x, y};

struct Stu        //类型声明
{
 char name[15];//名字
 int age;      //年龄
};
struct Stu s = {"zhangsan", 20};//初始化

struct Node
{
 int data;
 struct Point p;
 struct Node* next; 
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化

struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化

1.5结构体的使用

结构体中套用结构体：

struct apperance
{
	char eyes[10];
	char hair[10];
};
struct person
{
	char name[10];
	int age;
	int hight;
	struct apperance b;
};

结构体赋值和使用：
.是结构体成员访问符号。

int main()
{
	struct person a = { "张三",20,175,{"黑色","蓝色"} };//赋值

	printf("%s %d %d %s %s\n", a.name, a.age, a.hight, a.b.eyes, a.b.hair);
	printf1(a);//传值
	printf2(&a);//传地址

	return 0;
}

结构体传参
指针指向的地址，用->指向

void printf2(struct person* pa2)
{
	printf("%s %d %d %s %s\n", pa2->name, pa2->age, pa2->hight, pa2->b.eyes, pa2->b.hair);
}
void printf1(struct person pa1)
{
	printf("%s %d %d %s %s\n", pa1.name, pa1.age, pa1.hight, pa1.b.eyes, pa1.b.hair);
}

函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。
如果传递一个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能的下降。

1.6结构体内存对齐（结构体的大小）

结构体的大小如何计算？且先看下面的代码。

struct s1
{
	char a;
	char b;
	short c;
	int d;
};
struct s2
{
	char a;
	short c;
	int d;
	char b;
};
struct s3
{
	char a;
	int d;
	short c;
	int b;
};
int main()
{
	printf("%d\n", sizeof(struct s1));
	printf("%d\n", sizeof(struct s2));
	printf("%d\n", sizeof(struct s3));
	return 0;
}

先看一下运行结果：

结构体的成员一模一样，但其所占的字节数不同，这是为什么尼？因为结构体的对齐规则：

第一个成员在与结构体变量偏移量为0的地址处。
其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
VS中默认为8
结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。
如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整
体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。
所以上面代码在内存中的存储如下图所示：

为什么存在内存对齐?

大部分的参考资料都是如是说的：

1. 平台原因(移植原因)：
不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
2. 性能原因：
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访
问。
所以说，结构体的内存对齐是拿空间来换取时间的做法。那在设计结构体的时候，我们既要满足对齐，又要节省空间，所以让让占用空间小的成员尽量集中在一起。

1.7修改默认对齐数

我们可以修改结构体中的默认对齐数，需要借助#pragma这个预处理令。例如：

#pragma pack(2)//设置默认对齐数为8
struct S1
{
    char c1;
    int i;
    char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
    char c1;
    int i;
    char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认
int main()
{
    //输出的结果是什么？
    printf("%d\n", sizeof(struct S1));
    printf("%d\n", sizeof(struct S2));
    return 0;
}

计算结果为8和6，因为对齐数已经不再是8。
在这里插入图片描述

2.位段

2.1什么是位段

位段的声明和结构是类似的，并且位段的成员必须是 int、unsigned int 或signed int 。其次，位段的成员名后边有一个冒号和一个数字。其中数字代表的是比特位。
例如：

struct A
{
int _a:2;
int _b:5;
int _c:10;
int _d:30;
};

2.2位段的内存分配

1.位段的成员可以是 int 、unsigned int 、signed int 或者是 char （属于整形家族）类型
2.位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。
3.位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。
举一个例子(在VS2022环境下)：

struct S 
{
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};
int main()
{
	struct S s = { 0 };
	s.a = 10;
	s.b = 12; 
	s.c = 3;
	s.d = 4;
	//空间是如何开辟的？
}

数据在使用内存时，先使用低地址处的内存，再使用高地址处的。
一个字节代表8个比特位。
位段在使用内存时，先会向内存申请一个字节，当占满或剩余内存不够下一个数据的大小时，会再申请一个字节，而上一个字节未被使用的内存则被浪费。
在这里插入图片描述

2.3 位段的跨平台问题

int 位段被当成有符号数还是无符号数是不确定的。
位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机
器会出问题。
位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。
当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。
总结：
跟结构相比，位段可以达到同样的效果，但是可以很好的节省空间，但是有跨平台的问题存在。