一、结构体
1. 定义
结构体(struct)是由一系列具有相同类型或不同类型的数据构成的数据集合,也叫结构。
2. 声明
struct tag
{
member_list;
}variable_list;
例如:描述一个学生的基本信息
struct student
{
char name[10];
char sex[5];
int age;
}; //切记分号不能丢
不完全声明:
struct //省略标签tag
{
int a;
char b;
}x;
struct //省略标签tag
{
int a;
char b;
}*p;
int main()
{
p = &x;
system("pause");
return 0;
}
程序运行后:warning C4133: “=”: 从 “ * ” 到 “ * ” 的类型不兼容 (p = &x)
说明:编译器会把上面两个结构体声明当成完全不同的两个类型,= 两边类型不一致,故而是非法的。
3. 结构体的成员
可以是标量、数组、指针和其他结构体
struct A
{
int x;
int y;
};
struct B
{
int num;
char arr[10];
int *p;
struct A s;
};
4. 结构体成员的访问
(1)点操作符(.)
用法:结构体 . 成员名
struct student
{
int age;
char name[10];
};
int main()
{
struct student A;
A.age = 20;
strcpy(A.name, "Tom");
return 0;
}
(2)指向操作符(->)
用法:结构体指针 -> 成员名
struct student
{
int age;
char name[10];
}A;
int main()
{
struct student *p = &A;
p->age = 20; //等价于 (*p).age = 20;
strcpy(p->name, "Tom"); //等价于 strcpy((*p).name, "Tom");
return 0;
}
5. 结构体的自引用
当某个结构体的成员包含该结构体本身时,就称为该结构体的自引用
struct Node
{
int date;
struct Node next;
};
执行上述代码后:error C2079: “next”使用未定义的 struct“Node”
说明:由于该结构体的自引用,导致结构体的字节大小是未知的,这是非法的
正确方式:
struct Node
{
int date;
struct Node *next;
};
说明:由于指针占用4个字节,能正确计算出该结构体的字节大小,这是合法的
6. 结构的不完整声明
struct B; //对结构体B的不完整声明
struct A
{
int a;
struct B *pb;
};
struct B
{
int b;
struct A *pa;
};
7. 结构体变量的定义以及初始化
(1)定义
struct student
{
char name[10];
int age;
}stu1; //(1)声明类型的同时定义结构体变量stu1
struct student stu2; //(2)定义结构体变量stu2
(2)初始化:定义变量的同时赋初值
struct student
{
char name[10];
int age;
}stu1 = { "Helen", 18 }; //(1)
struct student stu2 = { "Tom", 20 }; //(2)
8. 内存对齐(重点)
当定义好一个结构体后,我们该如何计算出该结构体的字节大小呢?
实例:
struct student
{
char name[3];
int age;
}stu1;
int main()
{
printf("%d\n", sizeof(stu1));
return 0;
}
也许你会很快地算出是7,但是真的只是3+4这么简单吗?
在VS2013上运行后,我们发现结果为8,这是为什么呢?为了弄清楚这个问题,我们先要了解一个概念:内存对齐
结构体的对齐规则:
(1)第一个成员在与结构体变量偏移量为0的地址处,也就是说结构体第一个元素不需要偏移
(2)其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处
对齐数:编译器默认的一个对齐数与该成员大小的较小值
VS中默认的对齐数值为8,Linux中默认为4
#pragma pack(n)
:设置对齐数为n
(3)结构体总大小为最大对齐数(每个成员变量除了第一个成员都有一个对齐数)的整数倍
(4)如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍
接下来我们再分析一下上面的代码:
那么为什么要存在内存对齐呢?
(1)平台原因(移植原因)
不是所有的硬件平台都能访问任意地址上的任意数据的,某些硬件平台只能在某些地址处取某些特定类型的数据,否则出现硬件异常;
(2)性能原因
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于:为了访问未对齐的内存,处理器需要做两次内存访问,而对齐的内存访问仅需要一次。
总结:结构体的内存对齐是拿空间来换取时间的做法,在设计结构体时,我们尽量让空间小的成员集中在一起,这样不仅可以满足对齐要求,而且节省空间。
例如:
struct S1
{
char c1;
int i;
char c2;
}a;
struct S2
{
char c1;
char c2;
int i;
}b;
虽然上面两个结构体的成员一样,但它们的总大小是不一样的,结构体a的总大小为12,结构体b的总大小为8。因为结构体b空间小的成员更集中在一块,在满足内存对齐的基础上更加节省空间。
9. 结构体传参
强调:结构体传参不会降级,最好用指针传参
在函数传参时,参数需要压栈。如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,所以会导致性能下降。
二、位段
1. 定义
C语言允许在一个结构体中以位为单位来指定其成员所占内存长度,这种以位为单位的成员称为“位段”或称“位域”(bitfield)。
2. 声明
struct A
{
char a : 2;
char b : 3;
char c : 4;
char d : 5;
};
注意:
(1)位段的成必须是int、unsigned int、signed int或char类型;
(2)位段的成员名后边有一个冒号和数字。
3. 内存分配
(1)位段的空间是按照需要以4个字节(int)或1个字节(char)的方式来开辟的;
(2)位段涉及很多不确定因素,位段是不跨平台的,注意可移植的程序应避免使用位段。
接下来我们计算一下上述位段的大小:
说明: 先在一段存储空间上开辟2位给变量a,后面剩余6位,再开辟3位给b,剩余3位,不够存放c,则c存放在下一段存储空间上,开辟4位,剩余4位,不够存放d,d存放在下一段存储空间上,开辟5位,故而该位段的总大小为3。
4. 跨平台问题
(1)int位段被当成有符号数还是无符号数是不确定的;
(2)位段中最大位的数目不能确定(16位机器最大16,32位机器最大32,写成27,在16位机器上会出问题);
(3)位段中的成员在内存中从左向右分配,还是从右往左分配标准尚未定义;
(4)当一个包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
三、枚举
1. 定义
枚举(enum)在C中是一个被命名的整型常数的集合,日常生活中很常见,比如说一周有七天可以一一列举出来。
2. 结构形式
enum 枚举名
{
标识符(=整型常数),
标识符(=整型常数),
...
标识符(=整型常数)
}枚举变量;
如果枚举没有初始化,即省掉"=整型常数"时,则从第一个标识符开始,顺次赋给标识符0,1,2,…。但当枚举中的某个成员赋值后,其后的成员按依次加1的规则确定其值。
例如:
enum Num
{
x1,
x2,
x3 = 4,
x4,
x5 = 3,
x6
};
则x1=0,x2=1,x3=4,x4=5,x5=3,x6=4
注意:
(1)枚举中每个成员的结束符是 ‘,’ ,不是 ‘;’ ,最后一个成员可省略 ‘;’ ;
(2)初始化时可以赋负数,以后的标识符仍依次加1;
(3)枚举变量只能取枚举说明结构中的某个标识符常量。
3. 优点
(1)增加代码的可读性和可维护性;
(2)相对于宏定义,枚举有类型检查,更加严谨;
(3)防止了命名污染(封装);
(4)便于调试;
(5)使用方便,一次可以定义多个常量。
四、联合(共用体)
1. 特点
联合的成员共用一块内存空间
2. 联合大小的计算
(1)一个联合变量的大小至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员);
(2)当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
例如:
union date
{
short c[3];
int i;
};
int main()
{
printf("%d\n", sizeof(union date));
return 0;
}