基本定义:结构体通俗讲就像是打包封装,把一些有共同特征(比如同属于某一类事物的属性,往往是某种业务相关属性的聚合)的变量封装在内部,通过一定方法访问修改内部变量。具体一点说,结构体是让一些很散的数据变得很整,不管是网络传输,还是函数传参,还是为了便于你肉眼管理。
一、结构体的声明
1.1 结构的基础知识
结构体是一些数据的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
1.2 结构体的声明
1. 只有结构体定义,然后再结构体创建变量:
struct Student{ //声明结构体
char name[20]; //姓名
int num; //学号
float score; //成绩
};
struct Student stu1; //定义结构体变量
2.结构体变量的定义也可以与结构体的声明同时,这样就简化了代码:
struct Student{
char name[20];
int num;
float score;
}stu1;
3.匿名结构体类型:
struct
{
int a;
char b;
float c;
}x;
匿名结构体有且只能在项目中使用一次,而且要注意的是这样的方式虽然简单,但不能再次定义新的结构体变量了。
4.typedef修饰的结构体以及结构的自引用
typedef struct Node
{
int data;
struct Node* next;
}Node;//将typedef struct Node简化成Node
Node next1;
struct Node next2; //其实next1和next2都可以创建结构体
其实这里面涉及到结构的自引用的方法
看下面这段代码:
struct Node
{
int data;
struct Node next;
};
这段代码能运行吗?
显然是不能的,这种声明是错误的,因为这种声明实际上是一个无限循环,成员next是一个结构体,b的内部还会有成员是结构体,依次下去,无线循环。在分配内存的时候,由于无限嵌套,也无法确定这个结构体的长度,所以这种方式是非法的。
正确的方式:
struct Node
{
int data;
struct Node* next;
};
1.3结构体变量的定义和初始化
有了结构体类型,那如何定义变量,其实很简单。接下来我直接上代码:
普通结构体:
struct Point
{
int x;
int y; }p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
//初始化:定义变量的同时赋初值。
struct Point p3 = {1, 2};
struct Stu //类型声明
{
char name[15];//名字
int age; //年龄
};
struct Stu s = {"zhangsan", 20};//初始化
struct Node
{
int data;
struct Point p;
struct Node* next;
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化
结构体数组:
和普通数组差不多
//结构体中数组变量定义方法
struct stu{
int array[3];
int age;
};
//对于数组和变量同时存在的情况,有如下定义方法:
struct test student[3] = {{{66,77,55},18},
{{44,65,33},19},
{{46,99,77},17}};
//特别的,可以简化成:
struct test student[3] = {{66,77,55,18},
{44,65,33,19},
{46,99,77,17}};
结构体指针:
struct Student
{
char cName[20];
int number;
}student1={"xiaoming",666};
int main() {
struct Student* p;
p = &student1;
printf("%s %d", p->cName, p->cName);//结构体指针访问数据
}
用结构体指针变量访问结构体变量成员有以下两种方式:
(*p).cName //这里的括号不能少
p->cName
二、结构体大小计
2.1如何计算呢?
首先得掌握结构体的对齐规则:
- 第一个成员在与结构体变量偏移量为0的地址处。
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
( VS中默认的值为8)- 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
- 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
那我们直接看题吧,试试计算结构体大小:
struct S1
{
char c1;
int i;
char c2;
};
//printf("%d\n", sizeof(struct S1));
这个结构体大小是12,怎么算的呢?
首先c1与vs的对齐数比较,c1的对齐数为1,所以可以放在1的倍数的位置。
其次i与vs的对齐数比较,i的对齐数为4,所以可以放在4的倍数的位置,只有4才能放,123位置的空间全浪费了。
最后c2与vs的对齐数比较,c2的对齐数为1,所以可以放在1的倍数的位置。
结构体总大小为最大对齐数4(每个成员变量都有一个对齐数)的整数倍,所以只能又浪费3个空间,凑到4的倍数12的位置。
那我们再来看一个
struct S2
{
char c1;
char c2;
int i;
};
printf("%d\n", sizeof(struct S2));
这个结构体大小是8
同上可知,c1和c2放在0和1内存上,由于i的原因,2和3的空间被浪费了,所以i放在4-8的空间上。
那我们再来看看S1和S2结构体的区别:
S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别。从大小可以,S2用的空间比S1少,但S1和S2类型的成员一模一样,说明S2空间效率更好。
因此我们设计结构体的时候,尽量把数据从小到大排放,让占用空间小的成员尽量集中在一起,这样能使空浪费减少。
为什么存在内存对齐?
- 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
- 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访 问。
总体来说:
结构体的内存对齐是拿空间来换取时间的做法
补充一点,如何修改vs默认对齐数
#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
让我看一起来看个题吧!
写一个宏,计算结构体中某变量相对于首地址的偏移,并给出说明
这个宏是不是跟结构体地址对齐原理是一样的,其实就是offsetof 宏的实现。
#define offsetof(TYPE, MEMBER) ((size_t) &((TYPE*)0)->MEMBER)
计算结构体成员的偏移,有些自有代码里也会手写这样的代码,实际上这个函数是标准实现的。实际上如果我们浏览 ANSI C 编译器的标头文件,将在 stddef.h 中遇到这样奇怪的宏。这个红具有可怕的声明。此外,如果您查阅编译器手册,您会发现一个无益的解释,上面写着如下:
offsetof() 宏返回结构或联合复合中元素名称的偏移量。这提供了一种可移植的方法来确定偏移量。
2.2位段
什么是位段?
位段又称为位域。C语言中没有专门的位段类型,位段的定义要借助于结构体,即以二进制位为单位定义结构体成员所占存储空间。从而就可以按“位”来访问结构体中的成员,这一功能是很有用的。某些设备接口之间传输信息是以字节为单位的,字节中的不同位代表不同的控制信号,使用中常常需要单独置值或清零。又如C语言中没有逻辑量,是用0代表“假”,非0代表“真”。实际只需一个二进制位就可存储。利用位段就可以在一个字节中存放几个逻辑量。
位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是 int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字。
这个就是位段:
str**加粗样式**uct A {
char _a:3;
char _b:4;
char _c:5;
char _d:4;
};
printf("%d\n", sizeof(struct A));
那位段A的大小是多少?3个字节
怎么算的呢?
首先我们来看看,char a:2这个语句啥意思。这个就是给a分配两个比特位的空间。把a两个比特位的二进制倒着存于char类型的空间内。
而b呢,由于3+4小于8所以不用创建新的内存空间,接着a前面继续存放。
但c,3+4+5大于一个字节所有空间,所以放不下c了,得重新再开辟一个新空间,倒着存放c的二进制。
同理,d也得重新开辟一个新空间存放。
总计,使用了三个字节的空间。
位段的跨平台问题
- int 位段被当成有符号数还是无符号数是不确定的。
- 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。
- 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
- 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在
位段的应用