一、什么是结构体
C语⾔已经提供了内置类型,如:char、short、int、long、float、double等,但是只有这些内置类 型还是不够的,还有一些类型并不是单一的,而是需要多种内置类型才能实现的。于是,C语⾔增加了结构体这种⾃定义的数据类型,让程序员可以⾃⼰创造适合的类型。
结构是⼀些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量,如: 标量、数组、指针,甚⾄是其他结构体。
二、 结构体类型的声明
struct,是结构体的关键字。
比如,我们想描述一本书,包括书的书名,封面颜色,书本价格。可以如下声明:
struct book
{
char name[20];//书名
char colour[10];//封面颜色
int money;//书本价格
};//注意在这有一个分号
不过,其实还有一种特殊的声明方式,叫做“结构体的不完全声明” ———“匿名结构体”:
//匿名结构体
struct//在这少了结构体标签,大家对比上面的声明即可看出
{
char arr[10];
int num;
}x;
struct
{
int num1;
int n;
float y;
}*y;
//但是这种匿名声明有很多局限性,比如看如下代码正确与否
int main()
{
y = &x;
return 0;
}
很明显,这代码是错的,因为,在编译器看来,这两个结构体是完全不同的类型,所以是非法的。匿名的结构体类型,如果没有对结构体类型重命名的话,基本上只能使⽤⼀次。
三、 结构体变量的创建和初始化
我们拿一个例子:
#include<stdio.h>
struct book
{
char name[20];
char colour[10];
int money;
};
int main()
{
struct book bk = { "shuxue","blue",20 };//按照结构体顺序初始化
printf("%s %s %d\n", bk.name, bk.colour, bk.money);
//按照制定顺序初始化
struct book bk1 = { .colour = "blue",.name = "shuxue",.money = 20 };
printf("%s %s %d",bk1.name,bk1.colour,bk1.money);
return 0;
}
以上有两种初始化方式,一种是按照struct中定义的顺序进行初始化,也可以依照第二种方式,其中“.”是结构体的解引用符号,在后面我们会提到。
四、结构成员访问操作符
1、结构成员体的直接访问“.”
“.”——点操作符,这个就是直接访问的解引用符,在上面我们也有提到。点操作符需要两个操作数。使用方式如下,结构体变量.成员名:
#include<stdio.h>
struct book
{
char name[20];
char colour[10];
int money;
};
int main()
{
struct book bk = { "yuwen","gree",15 };
printf("%s %s %d\n", bk.name, bk.colour, bk.money);
struct book bk1 = { "English","red",10 };
printf("%s %s %d", bk1.name, bk1.colour, bk1.money);
return 0;
}
运行结果如下:
yuwen gree 15
English red 10
D:\编程\text_c\text_4.5\x64\Debug\text_4.5.exe (进程 12136)已退出,代码为 0。
按任意键关闭此窗口. . .
2、间接引用操作符“->”
有时候我们得到的不是⼀个结构体变量,⽽是得到了⼀个指向结构体的指针,则需要使用指针进行访问结构体。如下所⽰:
#include<stdio.h>
struct book
{
char name[20];
char colour[10];
int money;
};
int main()
{
struct book bk = { "yuwen","gree",15 };
struct book* prt = &bk;
printf("%s %s %d\n", prt->name, prt->colour, prt->money);
return 0;
}
使用方式:结构体指针->成员名
五、结构体的自引用
在结构中包含⼀个类型为该结构本⾝的成员是否可以呢? ⽐如,定义⼀个链表的节点:
struct str
{
int num;
struct str next;
};
上述代码正确吗?如果正确,那 sizeof(struct Node) 是多少? 仔细分析,其实是不⾏的,因为⼀个结构体中再包含⼀个同类型的结构体变量,这样结构体变量的⼤ ⼩就会⽆穷的⼤,是不合理的。 正确的⾃引⽤⽅式:
struct str
{
int num;
struct str* next;//使用指针
};
在结构体⾃引⽤使⽤的过程中,夹杂了 typedef 对匿名结构体类型重命名,也容易引⼊问题,看看 下⾯的代码,可⾏吗?
typedef struct
{
int data;
x* next;
}x;
很显然,是不行的,因为x是对前⾯的匿名结构体类型的重命名产⽣的,但是在匿名结构体内部提前使⽤x类型来创建成员变量,这是不⾏的。
解决⽅案如下:定义结构体不要使⽤匿名结构体了
typedef struct x
{
int data;
struct x* next;
}x;
六、结构体内存对⻬
好了,在了解了以上知识后,让我们来探究一下,结构体的大小是怎样的。
先看如下代码:
#include<stdio.h>
struct str
{
char a;
int num;
char b[3];
};
int main()
{
struct str ar = { 0 };
int sz = sizeof(ar);
printf("%d", sz);
return 0;
}
大家不妨想想,sz到底有多大呢,是六个还是其他个字节呢?
12
D:\编程\text_c\text_4.5\x64\Debug\text_4.5.exe (进程 24232)已退出,代码为 0。
怎么样,大家有没有猜到呢,如果没猜到的话,不妨听小编为你一解:计算结构体的⼤⼩,首先的了解一个知识:结构体内存对⻬ 。
⾸先得掌握结构体的对⻬规则: 1. 结构体的第⼀个成员对⻬到和结构体变量起始位置偏移量为0的地址处 2. 其他成员变量要对⻬到某个数字(对⻬数)的整数倍的地址处。 对⻬数 = 编译器默认的⼀个对⻬数 与 该成员变量⼤⼩的较⼩值。
- VS 中默认的值为 8 - Linux中 gcc 没有默认对⻬数,对⻬数就是成员⾃⾝的⼤⼩ 3. 结构体总⼤⼩为最⼤对⻬数(结构体中每个成员变量都有⼀个对⻬数,所有对⻬数中最⼤的)的 整数倍。 4. 如果嵌套了结构体的情况,嵌套的结构体成员对⻬到⾃⼰的成员中最⼤对⻬数的整数倍处,结构 体的整体⼤⼩就是所有最⼤对⻬数(含嵌套结构体中成员的对⻬数)的整数倍。
为什么存在内存对⻬?
1. 平台原因 (移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定 类型的数据,否则抛出硬件异常。
2. 性能原因: 数据结构(尤其是栈)应该尽可能地在⾃然边界上对⻬。原因在于,为了访问未对⻬的内存,处理器需要 作两次内存访问;⽽对⻬的内存访问仅需要⼀次访问。假设⼀个处理器总是从内存中取8个字节,则地 址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对⻬成8的倍数,那么就可以 ⽤⼀个内存操作来读或者写值了。否则,我们可能需要执⾏两次内存访问,因为对象可能被分放在两 个8字节内存块中。 总体来说:结构体的内存对⻬是拿空间来换取时间的做法。
通过以上可知,让占⽤空间⼩的成员尽量集中在⼀起,可以既满足内存对齐,又可以节省内存:
#include<stdio.h>
struct str
{
char a;
int num;
char b;
};
struct str1
{
char a;
char b;
int num;
};
int main()
{
struct str ar = { 0 };
struct str1 ar1 = { 0 };
int sz = sizeof(ar);
printf("%d\n", sz);
printf("%zd", sizeof(ar1));
return 0;
}
12
8
D:\编程\text_c\text_4.5\x64\Debug\text_4.5.exe (进程 10296)已退出,代码为 0。
修改默认对⻬数 #pragma 这个预处理指令,可以改变编译器的默认对⻬数。#pragma pack(1) //设置默认对⻬数为1。结构体在对⻬⽅式不合适的时候,我们可以⾃⼰更改默认对⻬数。#pragma pack()//取消设置的对⻬数,还原为默认。
七、结构体传参
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。 如果传递⼀个结构体对象的时候,结构体过⼤,参数压栈的的系统开销⽐较⼤,所以会导致性能的下降。所以结构体传参的时候,要传结构体的地址。