摘要:结构体是 C 语言中一种用户可自定义的数据类型,它允许存储不同类型的数据项。
struct
为了定义结构体,必须使用 struct 语句。struct 语句定义了一个包含多个成员的新的数据类型,struct 语句的标准格式如下:
struct tag {
member-list
member-list
member-list
...
} variable-list ;
- tag 是结构体标签。
- member-list 是标准的变量定义,比如 int i或者 float f,或者其他有效的变量定义。
- variable-list 结构变量,定义在结构的末尾,最后一个分号之前,我们可以指定一个或多个结构变量。
在一般情况下,tag、member-list、variable-list 这 3 部分至少要出现 2 个。
1 结构体类型的定义
1、定义形式
结构体内部的元素,也就是组成成分,我们一般称为"成员"。
结构体的一般定义形式为:
struct 结构体名{
类型名1 成员名1;
类型名2 成员名2;
……
类型名n 成员名n;
};
2、举例
比如,我们定义一个学生
struct Student{
char*name; //姓名
int age; //年龄
float height;//身高
};
上面定义了一个叫做Student的结构体,共有name、age、height3个成员。
2 结构体变量的定义
前面只是定义了名字为Student的结构体类型,并非定义了一个结构体变量,就像int一样,只是一种类型。
接下来定义一个结构体变量,方式有好多种。
1、先定义结构体类型,再定义变量
struct Student{
char*name; //姓名
int age; //年龄
float height;//身高
};
struct Student stu;
定义了一个结构体变量,变量名为stu。struct和Student是连着使用的。
2、定义结构体类型的同时定义变量
struct Student{
char*name; //姓名
int age; //年龄
float height;//身高
}stu;
结构体变量名为stu。
3、直接定义结构体类型变量,省略类型名
struct {
char*name; //姓名
int age; //年龄
float height;//身高
}stu;
结构体变量名为stu,但因为没有tag(结构体标签),所以后面就没法用该结构体定义新的变量。
其他注意事项:
1、不允许对结构体本身递归定义,如下做法是错误的,注意第3行
struct Student { int age; struct Student stu; };
2、结构体内可以包含别的结构体
struct Date { int year; int month; int day; }; struct Student { char *name; struct Date birthday; //结构体成员可以为结构体 };
3、定义结构体类型,只是说明了该类型的组成情况,并没有给它分配存储空间,就像系统不为int类型本身分配空间一样。只有当定义属于结构体类型的变量时,系统才会分配存储空间给该变量
struct Student { char *name; int age; };
4、使用typedef起别名,标签可有可无,结构体变量 位置变为该 类型名
typedef struct Student{ //Student 可有可无 char name[20]; //姓名 int age; //年龄 float height; //身高 }Stu; //Stu 为类型名 Stu stu; //Stu 为类型名,stu 为结构体变量
5、注意,字符串初始化不能直接赋值,需要使用 strcpy 函数
#include <stdio.h> #include <string.h> typedef struct { int n; float m; char name[20]; }Ptr; int main (void) { Ptr p; //Ptr p = {11, 12.9, "hello"}; strcpy (p.name, "hello"); //注意字符串不能直接赋值 p.n = 11; p.m = 12.9; printf ("n = %d, name = %s, m = %g\n", p.n, p.name, p.m); return 0; } 输出结果: n = 11, name = hello, m = 12.9
3 结构体变量的初始化
将各成员的初值,按顺序地放在一对大括号{}中,并用逗号分隔,一一对应赋值。
比如初始化Student结构体变量stu
struct Student {
char *name;
int age;
};
struct Student stu = {"MJ", 27};
只能在定义变量的同时进行初始化赋值,初始化赋值和变量的定义不能分开,下面的做法是错误的:
struct Student stu;
stu = {"MJ", 27};
4 结构体变量的使用
1、一般对结构体变量的操作是以成员为单位进行的,引用的一般形式为:结构体变量名.成员名
struct Student {
char *name;
int age;
};
struct Student stu;
stu.age = 27; // 访问stu的age成员........(2)
(2)行对结构体的age成员进行了赋值。"." 称为成员运算符,它在所有运算符中优先级最高。
2、如果某个成员也是结构体变量,可以连续使用成员运算符"."访问最低一级成员
struct Date {
int year;
int month;
int day;
};
struct Student {
char *name;
struct Date birthday;
};
struct Student stu;
stu.birthday.year = 1986;
stu.birthday.month = 9;
stu.birthday.day = 10;
3、相同类型的结构体变量之间可以进行整体赋值
struct Student {
char *name;
int age;
};
struct Student stu1 = {"MJ", 27};
struct Student stu2 = stu1; // 将stu1直接赋值给stu2
printf("age is %d", stu2.age);
输出结果为:
age is 27
5 结构体数组
1、定义
跟结构体变量一样,结构体数组也有3种定义方式
//定义1
struct Student {
char *name;
int age;
};
struct Student stu[5];
//定义2
struct Student {
char *name;
int age;
} stu[5];
//定义3
struct {
char *name;
int age;
} stu[5];
上面3种方式,都是定义了一个变量名为stu的结构体数组,数组元素个数是5
2、初始化
struct {
char *name;
int age;
} stu[2] = { {"MJ", 27}, {"JJ", 30} };
也可以用数组下标访问每一个结构体元素,跟普通数组的用法是一样的
6 结构体作为函数参数
将结构体变量作为函数参数进行传递时,其实传递的是全部成员的值,也就是将实参中成员的值一一赋值给对应的形参成员。因此,形参的改变不会影响到实参。
首先在(3)行定义了一个结构体类型Student,在(4)行定义了一个结构体变量stu,并在(5)行将其作为实参传入到test函数,输出结果为:
形参是改变了,但是实参一直没有变过。
7 指向结构体的指针变量
- 每个结构体变量都有自己的存储空间和地址,因此指针也可以指向结构体变量
- 结构体指针变量的定义形式:struct 结构体名称 *指针变量名
- 有了指向结构体的指针,那么就有3种访问结构体成员的方式
结构体变量名.成员名
(*指针变量名).成员名
指针变量名->成员名
输出结果为:
8 结构体占用的内存
C语言会为结构体中的每个成员都分配内存,各成员在内存中连续排列。但结构体所占用的内存并非简单的是各成员占用内存的算术之和。为了CPU能够快速访问,提高访问效率,变量的起始地址应该具有某些特性,这就是所谓的“对齐”。比如4字节的int型变量,那它的起始地址就应该在4字节的边界上,即起始地址可以被4整除。
内存对齐遵循以下两个原则:
- 成员变量起始地址为该变量类型所占内存的整数倍,若不足则不足部分用数据填充至所占内存的整数倍。
- 该结构体所占总内存为结构体成员变量中最大数据类型的整数倍。
举例说明:
struct str2{
double a;
int b;
char c;
double d;
};
str2这个结构体占用24个字节,分析如下:
首先double类型的a占用内存地址为0~7,int类型的b起始地址为8,符合规则一,占用地址为8~11。char类型的c占一个字节,地址为12。那么double类型的d,起始地址为13吗?显然不是,满足规则一的地址是16,所以d起始地址为16,占用16~23。结构体总共24个字节,满足规则二。如果这个结构体最后再加一个成员变量 char e,那这个结构体占用的内存是多少?char类型的e起始地址为24,占用地址为24,但是结构体一种有25个字节,就不满足规则二了,怎么办呢?为了满足规则二,我们将25~31进行填充,因此整个结构体占用32个字节。
9 结构的自引用
在一个结构内部包含一个类型为该结构本身的成员是否合法呢?举上一个很简单但是很有说明度的例子:
struct SELF_REFL
{
int a;
struct SELF_REFL b;
int c;
};
这种引用是非法的,因为成员b是另外一个完整的结构,其内部还将包含它自己的成员b.这第二个成员又是另一个完整的结构,它仍将包含自己的成员b,这样重复下去将永无止境。类似一个永远不会终止的递归程序。但下面这个声明却是合法的,你能看出其中的区别吗?
struct SELF_REFL2
{
int a;
struct SELF_REFL2 *b;
int c;
};
这个声明和前面那个声明的区别在于b现在是一个指针而不是结构,编译器在结构的长度确定之前就已经知道了指针的长度,所以其自引用是合法的。
如果你觉得一个结构内部包含一个指向该结构本身的指针有些奇怪,请记住它事实上所指向的是同一种类型的不同结构。更加高级的数据结构,如链表和树,都是用这种技巧实现的。
10 结构体的不完整声明
有时候,你必须声明一些相互之间存在依赖的结构。即:其中一个结构包含了另一个结构的一个成员或多个成员。和自引用一样,至少有一个结构必须在另一个结构体内部以指针的形式存在。问题在于声明部分:如果每个结构都引用了其他结构的标签,哪个结构应该首先被声明呢?
该问题采用不完整声明来解决。它声明一个作为结构标签的标识符。然后,把这个标签用在不需要知道这个结构的长度的声明中,如声明指向这个结构的指针。接下来的声明把这个标签与成员列表联系在一起。
struct B; //对结构体B进行不完整声明
//结构体A中包含指向结构体B的指针
struct A
{
struct B *partner;
//other members;
};
//结构体B中包含指向结构体A的指针,在A声明完后,B也随之进行声明
struct B
{
struct A *partner;
//other members;
};
11 位段
有些信息在存储时,并不需要占用一个完整的字节, 而只需占几个或一个二进制位。例如在存放一个开关量时,只有0和1 两种状态, 用一位二进位即可。为了节省存储空间,并使处理简便,C语言又提供了一种数据结构,称为“位域”或“位段”。所谓“位域”是把一个字(不同机器最大长度可能不同:16位,32位)中的二进位划分为几 个不同的区域, 并说明每个区域的位数。每个域有一个域名,允许在程序中按域名进行操作。 这样就可以把几个不同的对象用一个字节的二进制位域来表示。
位域的定义和位域变量的说明位域定义与结构定义相仿,其形式为:
struct 位域结构名
{ 位域列表 };
其中位域列表的形式为: 类型说明符 位域名:位域长度
例如:
struct bs
{
int a:8;
int b:2;
int c:6;
};
因为位段的使用比较罕见,而且使用位段不利于代码的移植,所以这里我展开描述,具体的一些细节可参考《C和指针》第10.5节。
参考链接
- GB/T 15272-1994 (6.5.2.1)
- 《C和指针》第10章
- C语言结构体(Struct)_C语言中文网
- C语言中结构体占用内存问题 - 嗜血的草 - 博客园
- C 结构体 | 菜鸟教程
- C语言再学习 -- 结构和其他数据形式_不积跬步,无以至千里-CSDN博客
- 结构体之位域(位段)-galaren77-ChinaUnix博客