一、结构体基础知识
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量,如:标量、数组、指针,甚至是其它结构体。
1.结构的声明
struct tag
{
member-list;
}variable-list;
例如,描述一个学生:
struct Stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
};//分号不能丢
2.结构体变量的初始化
结构体中包含结构体:
3.结构成员访问操作符
①结构体成员的直接访问
结构体成员的直接访问是通过点操作符(.)访问的,点操作符接受两个操作数。
使用方式:结构体变量.成员名
②结构体成员的间接访问
#include <stdio.h>
struct Point
{
int x;
int y;
};
int main()
{
struct Point p = { 3, 4 };
struct Point* ptr = &p;
ptr->x = 10;
ptr->y = 20;
printf("x = %d y = %d\n", ptr->x, ptr->y);
return 0;
}
4.结构的特殊声明
在声明结构的时候,可以不完全的声明。
#include<stdio.h>
//匿名结构体:只能用一次
struct
{
char c;
int i;
double d;
}s = { 'x',100,3.14 };
int main()
{
printf("%c %d %lf\n", s.c, s.i, s.d);
return 0;
}
#include<stdio.h>
struct
{
char c;
int i;
double d;
}s;
struct
{
char c;
int i;
double d;
}*ps;
int main()
{
ps = &s;//非法的
return 0;
}
警告:
1.编译器会把上面的两个声明当成完全不同的两个类型,所以是非法的。
2.匿名的结构体类型,如果没有对结构体类型重命名,基本上只能使用一次。
二、结构体内存对齐
1.对齐规则
1.结构体的第一个成员对齐到和结构体变量起始位置偏移量为0的地址处。
2.其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数=编译器默认的一个对齐数与该成员变量大小的较小值
VS中默认的值是8
Linux中gcc没有默认对齐数,对齐数就是成员自身的大小
3.结构体总大小为最大对齐数(结构体中每个成员变量都有一个对齐数,所有对齐数中最大的)的整数倍。
4.如果嵌套了结构体的情况,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍。
练习:
#include<stdio.h>
struct S1
{
char c1;
int i;
char c2;
};
int main()
{
printf("%d\n", sizeof(struct S1));//12
return 0;
}
2.为什么存在内存对齐?
大部分的参考资料都是这样说的:
①平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
②性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。假设一个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对齐成8的倍数,那么就可以用一个内存操作来读或者写值了。否则,我们可能需要执行两次内存访问,因为对象可能被分放在两个8字节内存块中。
总体来说:结构体的内存对齐是拿空间来换取时间的做法。
在设计结构体时,既要满足对齐,又要节省空间,如何做:让占用空间小的成员尽量集中在一起
例如:
S1和S2类型的成员一模一样,但是S1和S2所占的空间大小是有区别的。
3.修改默认对齐数
#pragma这个预处理指令可以改变编译器的默认对齐数。
#include <stdio.h>
#pragma pack(1)//设置默认对⻬数为1
struct S
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的对⻬数,还原为默认
int main()
{
printf("%zd\n", sizeof(struct S));//6
return 0;
}
三、结构体传参
#include<stdio.h>
struct S
{
int arr[1000];
int n;
double d;
};
//结构体传参
void print1(struct S tmp)
{
int i = 0;
for (i = 0; i < 5; i++)
{
printf("%d ", tmp.arr[i]);
}
printf("%d ", tmp.n);
printf("%lf ", tmp.d);
printf("\n");
}
//结构体地址传参
void print2(struct S* ps)
{
int i = 0;
for (i = 0; i < 5; i++)
{
printf("%d ", ps->arr[i]);
}
printf("%d ", ps->n);
printf("%lf ", ps->d);
printf("\n");
}
int main()
{
struct S s = { {1,2,3,4,5},100,3.14 };
print1(s);
print2(&s);
return 0;
}
上面的 printl和 print2函数哪个好些?首选print2函数。
原因:函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。如果传递一个结构体对象时,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
结论:结构体传参的时候,要传结构体的地址。
四、结构体实现位段
1.什么是位段?
位段的声明和结构体是类似的,但有两个不同:
1.位段的成员必须是 int、unsigned int或signed int,在C99中位段成员的类型也可以选择其他类型。
2.位段的成员名后边有⼀个冒号和⼀个数字。
//位段式的结构
struct A
{
int _a : 2;//只占2个bit位
int _b : 5;//只占5个bit位
int _c : 10; //只占10个bit位
int _d : 30; //只占30个bit位
};
//结构体
struct A
{
int _a;
int _b;
int _c;
int _d;
};
#include<stdio.h>
struct A
{
int _a : 2;
int _b : 5;
int _c : 10;
int _d : 30;
};
int main()
{
printf("%d\n", sizeof(struct A));//8
return 0;
}
位段是专门用来节省内存的。位:二进制位
2. 位段的内存分配
①位段的成员可以是int、unsigned int或者是char等类型。
②位段的空间上是按照需要以4个字节(int)或者1个字节(char)的方式开辟。
③位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
1.申请到的一块内存中,从左向右使用,还是从右向左使用是不确定的。在VS上是从右向左使用的。
2.在VS上,剩余的空间不足下一个成员使用时, 会浪费掉。
3.位段的跨平台问题
①int位段被当成有符号数还是无符号数是不确定的。
②位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。)
③位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
④当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结:跟结构相比,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在 。解决:根据不同的平台写不同的代码~
4.位段使用的注意事项
位段的几个成员共有同一个字节,这样有些成员的起始位置并不是某个字节的起始位置,那么这些位置处是没有地址的。内存中每个字节分配一个地址,一个字节内部的bit位是没有地址的。所以不能对位段的成员使用&操作符,这样就不能使用scanf直接给位段的成员输入值,只能是先输入放在一个变量中,然后赋值给位段的成员。
#include<stdio.h>
struct A
{
int _a : 2;
int _b : 5;
int _c : 10;
int _d : 30;
};
int main()
{
struct A sa = { 0 };
scanf("%d", &sa._b);//这是错误的
//正确的⽰范
int b = 0;
scanf("%d", &b);
sa._b = b;
return 0;
}