结构体知识点
struct tag
{
member-list;
} variable-list;
- struct 关键字 tag为结构体的标签名
- struct tag结构体的类型
- member-list成员变量- -可以为多个成员
struct Book
{
char name[20];
int price;
char id[12];
}b4,b5,b6;//b4,b5,b6是全局的
int main()
{
//b1,b2,b3是局部变量
struct Book b1;
struct Book b2;
struct Book b3;
return 0;
}
- b1为创建了一本书的实体,b1,b2…b6为结构体变量
- b1,b2,b3是局部变量,但是b4,b5,b6是全局的
结构体变量的定义和初始化
struct S
{
char c;
int i;
}s1, s2;
struct B
{
double d;
struct S s;
char c;
};
int main()
{
//struct S s3 = {'x', 20};
struct B sb = { 3.14, {'w', 100},'q' };
printf("%lf %c %d %c\n", sb.d, sb.s.c, sb.s.i, sb.c);
return 0;
}
匿名结构体类型
- 结构体可以不完全声明
- 只能用一次,因为不能创建实体
- 直接创建一个变量s(把结构体标签tag省略)
struct
{
char c;
int i;
char ch;
double d;
} s;
匿名结构体创建的错误
struct
{
char c;
int i;
char ch;
double d;
} s;
struct
{
char c;
int i;
char ch;
double d;
}* ps;
int main()
{
ps = &s;//err
return 0;
}
- 虽然s和* ps两个成员是一样,但是在编译器看来它们的类型不一样- - 不允许
结构体的自引用
结构体里面可以包含结构体变量作为它的成员- -也可以包含自身的
- 结构体里面包含结构体
一个结构体类型包含另一个结构体类型作为它的成员变量
struct A
{
int i;
char c;
};
struct B
{
char c;
struct A sa;
double d;
};
- 错误自引用
结构体里面有结构体自己的成员类型- -err
struct N
{
int d;//4
struct N n;
};
int main()
{
struct N sn;
return 0;
}
结构体的自引用–数据结构
- 数据在内存中存储的结构
typedef struct Node
{
int data;
struct Node* next;//下一个结点的指针
}Node;
- 所以结构体的自引用正确的写法是包含同类型结构体的指针而不是同类型的结构体变量
错误写法
typedef struct
{
int data;
Node* next;
}Node;
int main()
{
Node n;
return 0;
}
结构体内存对齐—重点
struct S
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
int i;
double d;//8
};
struct S3
{
char c1;
char c2;
int i;
};
struct S4
{
double d;
char c;
int i;
};
struct S5
{
char c1;
struct S4 s4;
double d;
};
#include <stdio.h>
int main()
{
struct S s = {0};
struct S2 s2 = { 0 };
struct S3 s3 = { 0 };
struct S4 s4 = { 0 };
struct S5 s5 = { 0 };
//printf("%d\n", sizeof(s));//12
//printf("%d\n", sizeof(s2));//16
//printf("%d\n", sizeof(s3));//8
//printf("%d\n", sizeof(s4));//16
printf("%d\n", sizeof(s5));
return 0;
}
结构体的对齐规则:
- 第一个成员在与结构体变量偏移量为0的地址处。
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
- 每一个成员变量的对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。
- 结构体总大小为最大对齐数(所有成员变量对齐数中最大的)的整数倍。
-
struct S s = {0};,其实是让S的第一个成员变量为0,但是其他成员变量也默认为0
- 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
- 且指针在64位编译器下为8个字节,在32位编译器下为4个字节
输出结构体的大小sizeof()的图解:
大小(字节)
char :1
int :4
double:8
S2
S5(嵌套情况)
为什么存在内存对齐?
- 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址
处取某些特定类型的数据,否则抛出硬件异常。 - 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
总体来说:
结构体的内存对齐是拿空间来换取时间的做法。
既要满足对齐,又要节省空间,如何做到:
-
让占用空间小的成员尽量集中在一起。 S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别。
-
修改默认对齐数
#pragma 预处理指令,可以改变我们的默认对齐数。
#include <stdio.h>
默认对齐数是8
把默认对齐数改为2
#pragma pack(2)//--------------开始
struct S
{
char c1;
int i;
char c2;
};
#pragma pack()//-------------结束
int main()
{
printf("%d\n", sizeof(struct S));
return 0;
}
默认对齐数为8:
修改对齐数为2
对齐数设置为1- -没对齐
- 对齐数最好别设为奇数- -默认不对齐
#pragma pack(1)
struct S
{
char c1;//1 1 1
int i;//4 1 1
char c2;//1 1 1
};
#pragma pack()
int main()
{
printf("%d\n", sizeof(struct S));
return 0;
}
用宏(offsetof)计算结构体中某变量相对于首地址的偏移,并给出说明
- 考察:offsetof 宏的实现
#include <stddef.h>
struct S
{
char c1;
int i;
char c2;
};
int main()
{
printf("%d\n", offsetof(struct S, c1));//c1相对于结构体的偏移量
printf("%d\n", offsetof(struct S, i));
printf("%d\n", offsetof(struct S, c2));
return 0;
}
- 输出0 4 8刚好是c1,i,c2在内存中的对齐数
结构体传参
两种方式传参- -两种打印s
- 值传递方式:值传过去需要拷贝和原来一模一样的空间,传过去4004个字节过去存储
- 地址传递方式,指针4或者8个字节,传过去指针接收,还可以通过指针找回来,效率高
struct S {
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体值传参
void print1(struct S s) {
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps) {
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
- 函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降 - 结论: 结构体传参的时候,要传结构体的地址。
结构体位段- -节省空间
- 位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是 int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字(不能超过设置的类型的字节数- -例如int 类型4个字节- -数字不能超过32)
位段的内存分配
- 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
- 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
- 位段涉及很多不确定因素,位段是不跨平台的,注意可移植的程序应该避免使用位段。
16位 - int - 2byte - 16 bit
32位 - int - 4byte - 32 bit
struct A
{
//4个字节 - 32bit
int _a : 2;//_a 成员占2个bit位
int _b : 5;//_b 成员占5个bit位
int _c : 10;//_c 成员占10个bit位
int _d : 30;//_b 成员占30个bit位
};
int main()
{
printf("%d\n", sizeof(struct A));//8
return 0;
}
- 输出8(字节)
- 看到四个成员一共47个比特位但是,输出8个字节应该要有64个比特位,为什么呢?(一个字节8位bit)
因为成员的类型为int所以由位段的内存分配规则(只能分配四个字节或者一个字节),所以先开辟4个字节32个bit位来为成员进行分配,分配完前三个成员还剩16个bit位不够分配给第四个成员,所以又开辟了32个bit位才够分配,所以结果输出的是8
位段- -vs
- 位段具有跨平台的问题
struct S
{
char a : 3;
char b : 4;
char c : 5;
char d : 4;
};
int main()
{
struct S s = { 0 };
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
return 0;
}
低地址— --- — ---- ----------------------------------------------------------------------------------高地址
- 可以看出内存中空间是从右向左边分配(一个字节内部先使用右边再使用左边)- -这里和大小端存储的区别是,大小端是字节与字节之间,而它是字节内部
内存中真实的存储:即可以看到三个字节在内存中的存储
位段的跨平台问题
- int 位段被当成有符号数还是无符号数是不确定的。
- 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。
- 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
- 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的
位段的应用
有错误的地方虚心等待指正,感谢看了本篇文章!!