结构体
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量,可以是标量、数组、指针,甚至是其他结构体
struct是结构体关键字
结构体特殊的申明
匿名结构体类型 (不完全初始化)
尽管两个结构体元素内容相同,但是没有自己的标签,匿名结构体只能用一次,这简直就是一次体验卡嘛
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}a[20], *p;
上述两个结构都省略了结构体标签
结构体自引用
struct Node
{
int data;
struct Node next;
};
sizeof(struct node)是多少
结果是编译错误,由于struct Node 还未定义,你就再引用当然是编译错误的
这只是结构体包含同类型的结构体变量,而不是结构体的自引用
正确的自引用方式
struct Node
{
int data;
struct Node* next;
};
结构体自引用包含同类型的结构体指针
结构体如何实现自引用
数据结构:数据在内存中存储的结构
(链表,顺序表)线性数据结构
链表
结构体内存对齐
当对于结构体有了初步了解后,计算结构体大小就涉及到了结构体内存对齐了
#include <stdio.h>
struct s1
{
char a;
int b;
char c;
};
struct s2
{
char a;
char b;
int c;
};
struct s3
{
double a;
char b;
int c;
};
struct s4
{
char a;
struct s3 s3;
int c;
};
int main()
{
printf("%d\n", sizeof(struct s1));
printf("%d\n", sizeof(struct s2));
printf("%d\n", sizeof(struct s3));
printf("%d\n", sizeof(struct s4));
return 0;
}
计算规则如下
- 结构体的第一个成员,放在结构体变量再内存中存储位置的0偏移处开始
- 从第二个成员往后,都放在一个对齐数(成员大小和默认对齐数中的较小值)的整数倍的地址处
- 结构体的总大小,是结构体所有成员中对齐数最大的那个对齐数的整数倍
- 结构体嵌套了结构体,嵌套的结构体对齐到自己结构体里面最大的对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套的结构体)的整数倍
那么掌握了这些规则,再碰到计算结构体也就不是什么难事了
当当,结果不就出来了嘛,与你的猜想对不对呢
内存对齐的意义
平台移植性原因
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常
性能原因
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问
结构体对齐总的来说是哪空间来换取时间
修改默认对齐数
在不同的平台默认对齐数也是不同的,以vs举例其默认对齐数为8
默认对齐数的大小会影响我们计算结构体的大小,以及某些特定的机器默认对齐数在特定的情况下也不同
vs平台下修改默认对齐数
修改之后
修改默认对齐数的意义:结构体在对齐方式不合适的时候,我们可以自己更改默认对齐数
结构体的位段
位段依附于结构体,与结构体有相似之处两点不同
1.位段的成员必须是 int ,unsigned int,signed int 或者是 char 类型
2.位段的成员名后面有一个冒号和一个数字,
(冒号后跟一个数字代表成员占据几个数字比特位)
struct CHAR
{
unsigned int ch : 8; //8位
unsigned int font : 6; //6位
unsigned int size : 18; //18位
};
struct CHAR ch1;
struct CHAR2
{
unsigned char ch; //8位
unsigned char font; //8位
unsigned int size; //32位
};
struct CHAR2 ch2;
在ch1这个字段对象中,一共才占据了32位的空间。而第二个程序利用结构体进行声明,可以看出,处理相同的数据,CHAR2类型占用了48位空间,如果考虑边界对齐并把要求最严格的int类型最先声明进行优化,那么CHAR2类型则要占据64位的空间
位段的内存分配
- 位段的成员可以是 int unsigned int signed int 或者是 char 类型
- 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
- 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
- 不确定因素:比如上一个空间剩余了一些空间,还有数据没有存放完,还需要再开辟一块空间,那么是直接使用新的空间,还是使用上一块空间剩余的加上新开辟的空间,并没有明确的规定
以及位段的成员在内存中是从左到右还是从右向左是不确定的
看到这可能觉得这个存储方式跟大端小端存储方式是不是有些像,但是这两种其实是不一样的,大小端存储讨论的是字节的顺序,而位段是以一个字节为单位来讨论,(一个字节内部跟大小端字节序是没有关系的)
struct s1
{
char a: 3;
char b : 4;
char c : 5;
char d : 7;
};
struct s2
{
char a ;
char b ;
char c ;
char d ;
};
int main()
{
struct s1 s = { 0 };
s.a = 10;
s.b = 12;
s.c = 13;
s.d = 15;
printf("%d\n", sizeof(struct s1));
printf("%d\n", sizeof(struct s2));
return 0;
}
输出结果也是不一样的
由此可见,明显s1的大小小于s2说明利用位段能够用较少的位数存储数据
位段的跨平台性
上面说过位段涉及很多不确定因素,所以位段是不跨平台的
- int 位段被当成有符号数还是无符号数是不确定的
- 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题)
- 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
- 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的