1.结构体的类型声明
我们在之前学习过数组,它是由相同数据类型的数据,组成的集合。每个参数的类型都一致。
类比一下结构体 结构体是不同的数据类型的数据组成的集合。结构的每个成员可以是不同的类型的变量。
结构声明:
struct tag
{
member-list;
}variable-list;
struct: 结构体关键字
member-list: 结构体成员,花括号里边的都是结构体成员
variable-list: 结构体参数
tag: 结构体标签
利用结构体描述一本书
书的内容包括:书名,书号,定价,出版社,作者
#include <stdio.h>
struct bk
{
char name[20]; //书名//不能在结构体内部初始化变量
int num; //书号
char publish[20];//出版社
int memony; //定价
char person[20];//作者
};//结构体分号不能丢
int main()
{
struct bk book = { "唐诗三百首",101,"新华出版社",55,"张三" };//初始化结构体变量
printf("书的名字:%s\n", book.name);
printf("书号:%d\n", book.num);
printf("出版社:%s\n", book.publish);
printf("定价:%d\n", book.memony);
printf("作者:%s", book.person);
return 0;
}
运行结果:
特殊声明
在声明结构体时,可以不完全声明
//匿名结构体类型
struct
{
char a;
int b;
double c;
}d;
struct
{
char a;
int b;
double c
}*p
上面的两个结构体在声明的时候都省去了结构体标签(tag)
//上面的两个代码的基础上,下面的代码合理吗?
p = &p;
警告:编译器会把上面的两种声明当成完全不同的两种类型,所以是非法的.
2.结构体的自引用
在结构体中包含该结构体本身的成员是否可以呢?
代码如下:
struct Node
{
int data;
struct Node next;
//可行吗?
//如果可以那么sizeof(atruct Node)是多少呢?
};
根据代码可以这样理解:在struct Node类型创建的过程中,又有struct Node next 的建立,而strcut Node类型还没有创建完,又要建立struct Node next 显然struct Node next 的大小未知,所以要确定sizeof(struct Node)的大小,依赖于sizeof(struct Node next) 的大小,所以不能实现sizeof(struct Node).
所以代码不可行
正确的自引用方式:
代码如下:
struct Node
{
int data;
struct Node *next;
};
根据代码可以这样理解:在struct Node 结构体中,定义了一个整形,和一个结构体指针,结构体与类型无关,只和指针所在的平台有关,在32位平台上占4个字节,在64位平台上占用8个字节。
我们可以想一想实现结构体的自引用可以干什么,为什么要实现结构体,它到底有什么意义?
答:编辑主才疏学浅,目前只知道线性数据结构和树形数据结构,线性数据结构分为:数组和链表,树形数据结构分为:二叉树,红黑数树等等。
结构体的自引用其实就是为了实现链表做准备的。
请看以下图解:
typedef struct
{
int data;
Node *next;
}Node;//这样写代码可行否?
//不行
//解决方案
typedef struct Node
{
int data;
struct Node *next;
}Node;
//这样也是不行的,因为typedef是重定义,在结构体中,该结构体还没有建立完成,就要利用该结构体,
//typedef的应用场景:要当结构体建立完成后,才可以重定义
3.结构体的变量和初始化
有了结构体类型,那如何定义变量,其实很简单
#include <stdio.h>
struct point
{
int x;
int y;
}p1; //声明类型的同时进行定义变量p1,p1为全局变量
struct point1
{
int z;
int a;
struct point p;
struct point1 *next;
int b;
};
int main()
{
struct point p3 = {1,2};//初始化结构体变量p3 p3为局部变量
struct point1 p4 = {3,4,{1,2},NULL,5};//结构体嵌套初始化
printf("%d %d",p3.x,p3.y);
printf("%d %d %d %d %p,%d",p4.z,p4.a,p4.p.x,p4.p.y,p4.next,p4.b);
return 0;
}
4.结构体的内存对齐
当我们学到现在,有些人就很疑惑,结构体它在内存中是怎样分布的,占用的字节数又是多少?
例如以下代码:
#include <stdio.h>
struct stu
{
int a;
char b;
char c;
};
int main()
{
printf("ret = %d", sizeof(struct stu));
return 0;
}
大家先想一想,不要往下看,它占用的字节数是多少?
难道是 int(占用4个字节) + char(占用1个字节) + char(占用一个字节) = 6
难道占用6个字节吗?
这种答案是不对的
运行结果:
为什么字节数会是8呢?
这就和结构体内存对齐有着莫大的关系了。
首先掌握结构体的对齐规则:
1.第一个结构体成员在结构体变量的偏移量为0的地址处
2.其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器的默认对齐数(8)与该成员大小的较小值
3.结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
4.如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
练习:
//练习1
struct s1
{
char c1;
int i;
char c2;
};
printf("%d\n",sizeof(struct s1));
图示分析:
//练习2
struct s2
{
char c1;
char c2;
int d;
};
printf("%D",sizeof(struct s2));
图示分析:
//练习三
//大家看了上面的解析,这个我就不想详细解释了。
struct s3
{
double d;
char c;
int i;
};
图文解释:
//练习四
struct s4
{
char c1;
struct s3 s3;
double d;
};
printf("%d",sizeof(struct s4));
图文解释:
为什么存在内存对齐呢?
1.平台原因(移植问题):不是说有平台都能访问任意低智商的任意数据的,某些硬件平台智能在某些地址处取某些特定类型的数据,否则会排除硬件异常。
2.性能原因:数据结构(尤其是栈)应该尽可能的在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要进行两次内存访问,而对齐的内存访问仅需要一次访问。
图示解析:
总体的说:结构体的内存对齐是用空间换取时间。
那在设计结构体的时候,想节省空间,又想代码的执行效率提高,该这样设计呢?
应该尽量的把字节数小的参数,排在结构体前面,这样可以减少在内存访问中,内存中未被利用的字节减少。
struct s1
{
char c1;
int i;
char c2;
};
//结构体大小为:12
struct s2
{
char c1;
char c2;
int i;
};
//结构体大小为:8
s1和s2类型成员一模一样,当时s1和s2所占的空间大小有差异
修改对齐数
#pragma pack() 可以改变默认对齐数
#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
char c1;
int i;
char c2;
};
//结构体大小:1(char)+3(未被利用)+4(int)+1(char)+3(未被利用) = 12
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为8
struct S2
{
char c1;
int i;
char c2;
};
//结构体大小:1(char)+4(int)+1(char) = 6
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
//输出的结果是什么?
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
return 0;
}
结论:结构在对齐方式不合适的时候,我没可以改变默认对齐数
面试题 写一个宏,计算结构体中某变量相对于首地址的偏移,并给出说明
其实就是考察的是 offsetof宏的实现,在这里我们先会使用offsetof,在后期,我们在模拟实现它。
offsetof介绍:offsetof (type,member)
头文件:stddef.hj
#include <stdio.h>
#include <stddef.h>
struct s
{
char c1;
char c2;
int i;
};
int main()
{
printf("%d\n", offsetof(struct s, c1));
printf("%d\n", offsetof(struct s, c2));
printf("%d\n", offsetof(struct s, i));
return 0;
}
图文演示:
5.结构体的传参
struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
上面的printf1和printf2函数那个更好?
答案是printf2更好
因为在传参的时候,参数会压栈,会有时间上和空间上的系统开销。
如果传递一个结构体对象的时候,结构体较大,参数压栈的系统开销就会变大,所以会导致性能的下降。
在传参时,如果使用临时变量进行传参,就会形成一个临时拷贝,空间上开销变大。
在传参时,如果使用地址传参,就会降低空间在系统上的开销、
结论:在结构体传参的时候,传结构体的地址。
6.结构体实现位段(位段的填充性和可移植性)
位段
什么是位段呢?
位段的声明和结构是类似的,但有两点不同
1.位段的成员必须是 int ,unsigned int 或signed int
2.位段的成员后边,有一个冒号和一个数字。
例:
struct A
{
int _a:2;
int _b:5;
int _c:10;
int _d:20;
}
printf("%d",sizeof(struct A));
A是一个位段类型,那A的大小是多少呢?
其实变量后面的冒号后面给的是该变量参数,在内存中在的bit位
位段的内存分配;
1.位段的成员可以是int ,unsigned int,signed int或者是char (属于整形家族)类型
2.位段的空间上是按照要求需要以4个字节(int)或者1个字节(char)得方式开辟的
3.位段涉及的不确定有很多,位段是不跨平台的,注重可移植行的程序应该避免使用。
图示分析上述代码:
举一个例子:
struct S
{
char a:3; //3个bit位
char b:4; //4个bit位
char c:5; //5个bit位
char d:4; //4个bit位
};
struct S s = {0};
s.a = 10;//二进制位 1010
s.b = 12;//二进制位 1100
s.c = 3; //二进制位 0011
s.d = 4; //二进制位 0100
//空间是如何开辟的?
图文解释:
位段的跨平台问题:
1.int 位段被当成用符号或者是无符号数不能确定
位段的最大数目不能确定,(在16位机器上最大是16个bit位,32位机器最大是32,如果写成27,在16位机器上就会出问题)
位段中的成员在内存中,是从右到左分配,还是从左到右分配未定义
当一个结构包含两个位段,第二个位段较大时,不足以在第一个位段的剩余位容纳时,是舍弃从新开辟字节数还是,利用剩下的bit位,这是不确定的。
总结:
相比结构而言,位段可以达到相同的效果,但是可以很好地节省空间,但是跨平台存在问题。
位段的应用:
7.枚举
枚举—顾名思义就是一一列举。
比如说生活中有一个星期一共有七天,可以一一列举
人的性别,有男,有女,有保密,也可以一一列举
枚举类型:关键字:enum
枚举定义:
enum days //星期
{
MON,
TUES,
WON,
THU,
FRI,
SAT,
SUN,
};
enum sex //性别
{
FALE,
FEMALE,
SELECT,
}
enum colour //颜色
{
BLUE,
YEALLOW,
GREEN,
}
这些定义的是enum day ,enum sex,enum colour 都是枚举类型,在花括号{}都是枚举常量,枚举常量不可被修改。
这些枚举常量都是有默认值的,默认从0开始。
#include <stdio.h>
enum en
{
BLUE,
GREEN,
YELLOW,
}
int main()
{
printf("%d",BLUE);
printf("%d",GREEN);
printf("%d",YELLOW);
return 0;
}
枚举的优点:
增加了代码的可读性和可维护性
和#define定义的标识符比较枚举有类型检查,更加严谨
防止了命名污染
便于调试
使用方便,一次可以定义多个变量
枚举的使用
enum Color//颜色
{
RED=1,
GREEN=2,
BLUE=4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值,才不会出现类型的差异
clr = 5 //可以吗?答:不行,因为枚举常和普通常量不同,编译时会出现警告
8.联合体
联合体的定义:联合体是一种特殊的自定义数据类型,他包括一系列的成员变量,它的特点是,成员变量共同利用一块内存空间,所以联合体又被称为共用体。
请看代码:
#include <stdio.h>
//联合类型的声明
union Un
{
char c;
int i;
};
int main()
{
//联合变量的定义
union Un un;
//计算连个变量的大小
printf("%d\n", sizeof(un));
printf("%p\n", &un);
printf("%p\n", &un.c);
printf("%p\n", &un.i);
return 0;
}
在我们没有学过联合体的时候:它的整体的大小为8,当时是根据结构体内存对齐算出来的,1(char) +3(未被利用)+4(int) = 8 ,因为最大的对齐数值4,在已知的大小中8恰好是4的倍数,所以它的大小为8,
但是这个是联合体,它的大小可不见的是8哦。
代码运行结果:
联合体的大小为什么是4呢?
答:因为char 和 int 共用个一个字节,在运行结果中两个变量的地址都是一样的,这足以证明它们共用了一块内存
详细请看图:
联合体的特点
联合体成员是公用一块内存空间的,这样一个联合体的大小,至少是最大成员的大小(因为联合至少有能力保存最大的那个成员)
某度的面试题
判断当前计算机是小端存储还是大端存储
1.回顾以前,我们用的方法是:已知1的十六进制为 00 00 00 01 在小端存储为 01 00 00 00 ,在大端存储为 00 00 00 01,我们把int 类型的1强制转化为char类型,char 类型在内存中访问一个字节,所以大段的时候访问的是 00
小段的时候访问的是01,所以在判断的时候只需要当强制转化的结果为1时,我们就返回小端,否则为大端。
#include <stdio.h>
int Judge()
{
int num = 1;
char n = (char)num;
return n;
}
int main()
{
int ret = Judge();
if (ret == 1)
{
printf("小端存储\n");
}
else
{
printf("大端存储\n");
}
return;
}
2.那我们用联合体怎样实现呢?
我们设置一个int类型的变量为1,占用4个字节,设置一个char类型的变量,把int 变量赋为1,这时char类型的变量值也进行了改变,如果是大端存储char 这个字节中存的是 00,否则存的是01
#include <stdio.h>
union un
{
char c;
int i;
};
int main()
{
union un u;
u.i = 1;
if (u.c == 1)
{
printf("小端存储\n");
}
else
{
printf("大端存储\n");
}
return 0;
}
运行结果:
联合体的计算
联合的大小至少是最大成员的大小,
当最大成员的大小不是最大对齐数的整数倍时,就要对齐到最大对齐数的整数倍。
#include <stdio.h>
union un
{
char s[7];
int i;
};
int main()
{
printf("%d", sizeof(union un));
return 0;
}
运行结果: