1.什么是结构体
结构体是C语言中一种非常重要的自定义数据类型,它允许存储不同类型的数据项作为其成员。结构体中的成员可以是基本数据类型(如 int、float、char 等),也可以是其他结构体类型、指针类型等。
如果我们需要描述一本书的属性,如书名、作者、出版社、价格、编号等属性,那么C语言自带的基本数据类型肯定是不够用了。为此,C语言提供了结构体,用于描述一个复杂的对象。结构体的定义(声明)如下:
struct tag {
member-list
member-list
member-list
...
};
其中 tag 是结构体标签。
member-list 是标准的变量定义,比如 int i; 或者 float f;或者是其他有效的变量定义。
以书为例,定义(声明)一个结构体类型:
struct Books
{
char title[20];
char author[20];
char code[20];
float price;
};
这里创建了一个用于描述书的类型,类型名为struct Books,其中的title、author、code及price为结构体成员,用于储存书的信息。
2.结构体变量的初始化
与常规变量一样,结构体也可以初始化,即在创建变量时指定初始值。
struct Books
{
char title[20];
char author[20];
char code[20];
float price;
} book = {"C程序设计", "谭浩强","9787302481447",59.90f};
book为初始化的变量,{"C程序设计", "谭浩强","9787302481447",59.90f}为初始化结构体的值,多组数据用花括号包起来,并且要按顺序填写。如果不按顺序写就要使用结构体成员访问操作符“.”来实现:
struct Books
{
char title[20];
char author[20];
char code[20];
float price;
} book = { .code = "9787302481447",.title = "C程序设计", .price = 59.90f ,.author = "谭浩强"};
其中,结构体变量还可以在后期定义:
struct Books
{
char title[20];
char author[20];
char code[20];
float price;
};
struct Books book = {"C程序设计", "谭浩强","9787302481447",59.90f};
在声明结构体的时候,我们可以不完全的声明,也就是省略掉结构体标签:
struct
{
int a;
char b;
float c;
long d;
} x;
此时该结构体就是匿名结构体,如果不使用typedef重新命名,只能在通过声明类型时创建变量,也就是只能用一次。
3.访问结构成员
为了访问结构的成员,我们使用成员访问运算符(.)。成员访问运算符是结构变量名称和我们要访问的结构成员之间的一个句号。可以使用 struct 关键字来定义结构类型的变量。基本访问用法是 结构体变量.成员名,下面的实例演示了结构的用法:
#include <stdio.h>
struct Books
{
char title[20];
char author[20];
char code[20];
float price;
} book = { .code = "9787302481447",.title = "C程序设计", .price = 59.90f ,.author = "谭浩强"};
int main()
{
printf("书名为:%s\n作者为:%s\n编码为:%s\n价格为:%.2f\n", book.title, book.author, book.code, book.price);
return 0;
}
#include <stdio.h>
#include <string.h>
struct Books
{
char title[20];
char author[20];
char code[20];
float price;
};
int main()
{
struct Books book;
strcpy(book.title, "C程序设计");
strcpy(book.author, "谭浩强");
strcpy(book.code, "9787302481447");
book.price = 59.90f;
printf("书名为:%s\n作者为:%s\n编码为:%s\n价格为:%.2f\n", book.title, book.author, book.code, book.price);
return 0;
}
结构体成员通过指针同样可以访问,基本访问方式是 结构体变量->结构体成员,实例:
#include <stdio.h>
#include <string.h>
struct Books
{
char title[20];
char author[20];
char code[20];
float price;
};
int main()
{
struct Books book;
struct Books* ptr = &book;
strcpy(ptr->title, "C程序设计");
strcpy(ptr->author, "谭浩强");
strcpy(ptr->code, "9787302481447");
ptr->price = 59.90f;
printf("书名为:%s\n作者为:%s\n编码为:%s\n价格为:%.2f\n", book.title, book.author, book.code, book.price);
return 0;
}
如果在函数中调用结构体,应当使用结构体指针进行传参,这样可以节省栈帧开销。
4.结构体内存对齐
看下面这段代码:
#include <stdio.h>
struct STRUCT1
{
int i;
int j;
char a;
char b;
};
struct STRUCT2
{
int i;
char b;
int j;
char a;
};
int main()
{
printf("%d\n%d", sizeof(struct STRUCT1), sizeof(struct STRUCT2));
return 0;
}
按照直觉,该结构体大小应该是10,为什么不是10,甚至还有两个结果?这是因为C语言里存在结构体内存对齐,会空出一部分空间来提高读取效率,被称为结构体内存对齐。C语言的对齐规则如下:
1.结构体的第一个成员要对齐到结构体变量的起始位置
2.其他成员变量要对齐到对齐数的整数倍的地址处
3.结构体的总大小必须为最大对齐数的整数倍(结构体中每个成员变量都有自己的对齐数,取所有对齐数中最大的)
4.如果出现了结构体嵌套结构体的情况,嵌套的结构体对齐到自己的成员中的最大对齐数的整数倍处,结构体的总大小就是所有最大对齐数(包含嵌套结构体中成员的对齐数)的整数倍
(对齐数 = 编译器默认的一个对齐数 和 该成员变量大小的较小值,vs中默认对齐数为8
Linux中gcc没有默认对齐数,对齐数就是成员自身的大小)
以上述代码的STRUCT1为例,i对齐到0处,因为i的大小为4个字节,所以i占用第0-3处内存,j的对齐数为4,因此对齐到4,占用4个字节,因此占用第4-7处内存,a对齐数为1,对齐到8,占用第8处内存,b对齐数为1,对齐到9,占用第9处内存,总大小是10,但结构体总大小应为最大对齐数的整数倍,而最大对齐数为4,因此结构体总大小为12。
为什么结构体会有内存对齐?
1. 平台原因 (移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定 类型的数据,否则抛出硬件异常。
2. 性能原因: 数据结构(尤其是栈)应该尽可能地在⾃然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要⼀次访问。假设⼀个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对⻬成8的倍数,那么就可以用一个内存操作来读或者写值了。否则,我们可能需要执行两次内存访问,因为对象可能被分放在两个8字节内存块中。 总体来说:结构体的内存对齐是拿空间来换取时间的做法。