一、结构体
1、定义:
结构体(struct)是由一系列具有相同类型或不同类型的数据构成的数据集合,也叫结构。
2、声明:
struct tag
{
member_list;
}variable_list;
例如:描述一个学生的基本信息
struct student { char name[20]; char sex[5]; int age;
char id[20]; }; //切记分号不能丢
不完全声明:
struct //省略标签tag(匿名结构体类型) { int a; char b; }x; struct //省略标签tag { int a; char b; }*p;
在以上的基础上,判断下面代码是否合法? int main() { p = &x; system("pause"); return 0; }
不合法:程序运行后:warning C4133: “=”: 从 “ * ” 到 “ * ” 的类型不兼容 (p = &x) 说明:编译器会把上面两个结构体声明当成完全不同的两个类型,= 两边类型不一致,故而是非法的。
3、结构体的成员:可以是标量、数组、指针和其他结构体。
struct A
{
int x;
int y;
};
struct B
{
int num;
char arr[10];
int *p;
struct A b;
};
4、结构体成员的访问
(1)点操作符(.)
用法:结构体.成员名
struct student { char name[20];
int age; }; int main() { struct student A; A.age = 20; strcpy(A.name, "ENSHADOWER"); return 0; }
(2)指向操作符(->)
用法:结构体指针 -> 成员名
struct student { char name[20];
int age; }A; int main() { struct student *p = &A; p->age = 20; //等价于 (*p).age = 20; strcpy(p->name, "ENSHADOWER"); //等价于 strcpy((*p).name, "ENSHADOWER"); return 0; }
5、结构体的自引用
当某个结构体的成员包含该结构体本身时,就称为该结构体的自引用。
正确方式:
struct Node
{
int date;
struct Node *next;
};
6、结构的不完整声明
struct B; //对结构体B的不完整声明
struct A
{
int a;
struct B *pb;
};
struct B
{
int b;
struct A *pa;
};
7、结构体变量的定义以及初始化
(1)定义:
struct student
{
char name[20];
int age;
}stu1; //(1)声明类型的同时定义结构体变量stu1
struct student stu2; //(2)定义结构体变量stu2(优先使用此定义格式)
(2)初始化:定义变量的同时赋初值
struct student
{
char name[20];
int age;
}stu1 = { "ENSHADOWER", 18 }; //(1)
struct student stu2 = { "ENSHADOWER", 20 }; //(2)
8、内存对齐 (重点)
当定义好一个结构体后,我们该如何计算出该结构体的字节大小呢?
举例如下:
struct student { char a; int b;
char c; }stu1; int main() { printf("%d\n", sizeof(stu1)); system("pause"); return 0; }
在VS2013上运行后,我们发现结果为12,这是为什么呢?在弄清楚这个问题之前,我们先要了解一个概念:内存对齐。
结构体的对齐规则:
(1)第一个成员在与结构体变量偏移量为0的地址处,也就是说结构体第一个元素不需要偏移;
(2)其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数:编译器默认的一个对齐数与该成员大小的较小值。
(编译器:VS中默认的对齐数值为8,Linux中默认为4。 )
(PS:#pragma pack(num) ———— 设置对齐数为num,最好为1、4、8)
(3)结构体总大小为最大对齐数(每个成员变量除了第一个成员都有一个对齐数)的整数倍。
(4)如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
接下来我们再分析一下上面的代码:
那么为什么要存在内存对齐呢?
(1)平台原因(移植原因)
不是所有的硬件平台都能访问任意地址上的任意数据的,某些硬件平台只能在某些地址处取某些特定类型的数据,否则出现硬件异常;
(2)性能原因
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于:为了访问未对齐的内存,处理器需要做两次内存访问,而对齐的内存访问仅需要一次。
总结:结构体的内存对齐是拿空间来换取时间的做法,在设计结构体时,我们尽量让空间小的成员集中在一起,这样不仅可以满足对齐要求,而且节省空间。
例如:
struct S1
{
char c1;
int i;
char c2;
}a;
struct S2
{
char c1;
char c2;
int i;
}b;
虽然上面两个结构体的成员一样,但它们的总大小是不一样的,结构体a的总大小为12,结构体b的总大小为8。因为结构体b空间小的成员更集中在一块,在满足内存对齐的基础上更加节省空间。
9、结构体传参
结构体传参的时候,要传结构体的地址。
强调:结构体传参不会降级,最好用指针传参
在函数传参时,参数需要压栈。如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,所以会导致性能下降。
二、位段
1、定义:
C语言允许在一个结构体中以位为单位来指定其成员所占内存长度,这种以位为单位的成员称为“位段”或称“位域”(bitfield)。
2、声明:
struct A
{
char a : 2;
char b : 3;
char c : 4;
char d : 5;
};
(1)位段的成必须是int、unsigned int、signed int或char类型 ;
(2)位段的成员名后边有一个冒号和数字。 (数字表示的是所需的比特位,一个字节=8个比特位)
3、内存分配
(1)位段的空间是按照需要以4个字节(int)或1个字节(char)的方式来开辟的;
(2)位段涉及很多不确定因素,位段是不跨平台的,注意可移植的程序应避免使用位段。
接下来我们计算一下上述位段的大小:
说明:先在一段存储空间(char大小为1字节即8个比特位)上开辟2位给变量a,后面剩余6位,再开辟3位给b,剩余3位,不够存放c,则c存放在下一段存储空间上,开辟4位,剩余4位,不够存放d,d存放在下一段存储空间上,开辟5位,故而该位段的总大小为3。
4、跨平台问题
(1)int位段被当成有符号数还是无符号数是不确定的;
(2)位段中最大位的数目不能确定(16位机器最大16,32位机器最大32,写成27,在16位机器上会出问题);
(3)位段中的成员在内存中从左向右分配,还是从右往左分配标准尚未定义;
(4)当一个包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
三、枚举
1、定义:
枚举(enum)在C中是一个被命名的整型常数的集合,日常生活中很常见,比如说一周有七天可以一一列举出来。
2、结构形式:
enum 枚举名
{
标识符(=整型常数),
标识符(=整型常数),
...
标识符(=整型常数)
}枚举变量;
当枚举未初始化时,第一个标识符默认的值为0,此后的成员按依次加1确定其值。
但当枚举中的某个成员赋值后,其后的成员按依次加1的规则确定其值。
例如:
enum Num
{
x1,
x2,
x3 = 3,
x4,
x5 = 7,
x6
};
则x1=0,x2=1,x3=3,x4=4,x5=7,x6=8
注意:
(1)枚举中每个成员的结束符是”,”,不是”;”,最后一个成员可省略”,”;
(2)初始化时可以赋负数,以后的标识符仍依次加1;
(3)枚举变量只能取枚举说明结构中的某个标识符常量。
3、优点:
(1)增加代码的可读性和可维护性;
(2)相对于宏定义,枚举有类型检查,更加严谨;
(3)防止了命名污染(封装);
(4)便于调试;
(5)使用方便,一次可以定义多个常量。
四、联合(共用体)
1、特点:
联合的成员共用一块内存空间
2、联合大小的计算:
(1)一个联合变量的大小至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员);
(2)当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
例如:
union date
{
short c[3];
int i;
};
int main()
{
printf("%d\n", sizeof(union date));
return 0;
}