目录
一、结构体
1.1结构的基础知识
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。(与数组区别开,数组是一组相同类型的元素的集合。)
一般形式:
struct tag //struct是关键字,tag是标签名
{
member-list ; //成员变量
} variable-list ; //结构变量,此处的 “ ;” 不能省略
1.2结构的声明
我们想表达一个数字,可以用int或者char等其他类型表示,如果我们想描述一本书呢?
#include<stdio.h>
struct Book
{
char name[20];
char author[10];
int price;
int ID;
}a;//全局变量(main函数大括号外部的变量是全局变量)
int main()
{
struct Book m = { "baikedaquan","zhangsan",43,142310 };//局部变量
struct Book a = { "zhishu","xiaoyang",99,102778 };
return 0;
}//变量m,a就是描述书这个类型的变量。
1.3特殊声明
在声明结构时,可以不完全的声明,也叫匿名结构体类型。
struct
{
int a;
char b;
double c;
}x;
struct
{
int a;
char b;
double c;
}*p; //结构类型的指针
匿名结构体类型,只能使用一次,用完之后就不能用了,因为匿名结构体类型没有标签,创建结构变量时,构不成一个类型。
上述2个结构在声明时省略了结构体标签,在此基础上,p = &x,合法吗?
虽然这2个结构的成员变量类型相同,但编译器会把这2个结构当作不同的类型,p = &x是非法的。
1.4结构体的自引用
在结构中包含一个类型为该结构本身的成员是否可以呢?
这样写对吗?
struct Node
{
int data;
struct Node next;
};
不对,编译器会报错: “next”使用未定义的 struct“Node” 。(或者也可以理解为死循环)
正确的自引用方式 (不是包含同类型的结构体变量,而是包含同类型的结构体指针):
struct Node
{
int data;
struct Node* next; //同类型的结构体的指针
};
类似于数据结构中的链表
1.5结构体变量的定义和初始化
定义结构体变量
struct Point
{
int x;
int y;
}p1;//声明类型的同时,定义结构体变量p1
int main()
{
struct Point p2;//定义结构体变量p2
return 0;
}
结构体初始化
struct Stu
{
char name[20];
int age;
};
int main()
{
struct Stu n = { "xiaoming",12 };
return 0;
}
结构体嵌套初始化
struct A
{
int x;
char y;
};
struct B
{
char s;
int m;
struct A i;
};
int main()
{
struct B n = { 'z',4,{2,'u'}};
return 0;
}
访问、打印结构体变量
struct A
{
int x;
char y;
};
struct B
{
char s;
int m;
struct A i;
};
int main()
{
struct B n = { 'z',4,{2,'u'}};
//.针对结构体变量,->针对结构体指针
printf("%c,%d,%d,%c\n", n.s, n.m, n.i.x, n.i.y);
return 0;
}
输出:
z,4,2,u
1.6结构体内存对齐
一个结构体的大小是多少呢?
#include<stdio.h>
struct s1
{
char a;
int b;
double c;
};
int main()
{
printf("%d\n", sizeof(struct s1));
return 0;
}
char占1个字节,int占4个字节, double占8个字节,相加,按这种想法,就是13个字节,那真的是这样吗?
输出:
16
为什么与想象的不同呢?这就牵扯到了一个问题:结构体内存对齐。
结构体的对齐规则:
- 第一个成员在与结构体变量偏移量为0的地址处。
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。 对齐数=编译器默认的一个对齐数 与 该成员大小的较小值。(VS默认对齐数为8)
- 结构体总大小为最大对齐数(每个成员变量都有一个自己的对齐数)的整数倍。
- 如果出现嵌套了结构体的情况,嵌套的结构体对齐到自己最大的对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
了解了结构体对齐规则后,分析上述代码,结构体大小为什么为16呢?
再来看一个例子:
#include<stdio.h>
struct s2
{
char a;
double c;
int b;
};
int main()
{
printf("%d\n", sizeof(struct s2));
return 0;
}
输出:
24
s1,s2这两个结构体成员变量是一样的,但是顺序不一样,也就导致了结构体大小不同。
再来看一个包含嵌套结构体的例子:
#include<stdio.h>
struct s1
{
char a;
char b;
int c;
};
struct s2
{
char d;
int e;
struct s1 f;
char g;
};
int main()
{
printf("%d\n", sizeof(struct s2));
return 0;
}
输出:
20
为什么会存在内存对齐呢?
- 平台原因(移植原因)
不是所有的硬件平台都能访问任意地址上的任意数据;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
- 性能原因
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作2次内存访问;而对齐的内存访问仅需要一次访问。
总体来说:
结构体的内存对齐是拿空间换时间的做法。
那在设计结构体的时候,如何既满足对齐,又节省空间呢?
应该让占用空间小的成员尽量集中在一起。
例:
1.7修改默认对齐数
使用预处理指令:#pragma
#include<stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct s1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为1
struct s2
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
printf("%d\n", sizeof(struct s1));
printf("%d\n", sizeof(struct s2));
return 0;
}
输出:
12
6
结论:结构在对齐方式不合适的时候,可以自己更改默认数。
【百度面试题】写一个宏,计算结构体中某变量相对于首地址的偏移,并给出说明。
考察:offsetof宏的实现
offsetof
offsetof (type,member)返回成员偏移量
此具有函数形式的宏返回数据结构或联合类型中成员成员的偏移值(以字节为单位)。
返回的值是size_t类型的无符号整数值,其字节数位于指定成员与其结构开头之间。
因为此处还未涉及宏的内容,只了解其用法,不进行具体实现。
#include<stdio.h>
#include<stddef.h>
struct n
{
int i;//4个字节
short j;//2个字节
long a;//4个字节
};
int main()
{
printf("%d\n", offsetof(struct n, i));
printf("%d\n", offsetof(struct n, j));
printf("%d\n", offsetof(struct n, a));
return 0;
}
输出:
0
4
8
1.8结构体传参
#include<stdio.h>
struct S
{
int data[1000];
int num;
};
void print1(struct S s)
{
printf("%d\n", s.num);
}
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
struct S s = { {1,2,3,4},1000 };
print1(s);//传结构体
print(&s);//传地址
return 0;
}
上面的 print1 和 print2 函数哪个好些?
答案:首选print2函数。
原因:函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
结论:结构体传参的时候,要传结构体的地址。
二、 位段
2.1 什么是位段
位段的声明和结构是类似的,有两个不同:
- 1.位段的成员必须是 int、unsigned int 或signed int 。
- 2.位段的成员名后边有一个冒号和一个数字。
例:
struct A
{
int _a : 2;
int _b : 5;
int _c : 10;
int _d : 30;
};
int main()
{
printf("%d\n", sizeof(struct A));
return 0;
}
输出:
8
这是为什么呢?
2.2 位段的内存分配
1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
再看一个例子:
struct A
{
int _a : 2;
int _b : 5;
int _c : 10;
int _d : 30;
};
struct S
{
char a : 3;
char b : 4;
char c : 5;
char d : 4;
};
int main()
{
struct S s = { 0 };
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
printf("%d\n", sizeof(struct S));//3
return 0;
}
输出:
3
这就证明:在VS环境,数据是按从低地址向高地址的顺序存放的,当一个整型的空间不够下一个成员使用时,这块空间会浪费掉,然后创建新的空间存放下一个成员 。
但是其他平台是未知的。
2.3 位段的跨平台问题
1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。(在16位机器上,int占2个字节,即16个bit位,在32位机器上,int占4个字节,即32个bit位,写成 int _d:27,在16位机器会出问题。)
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结:
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。
2.4位段的应用
三、枚举
枚举(enumerate),顾名思义,就是一一列举。
把可能的取值一一列举。
例如:
一周的星期一到星期日是有限的7天,可以一一列举。
性别有男女。
月份有12个月,也可以一一列举
3.1枚举类型的定义
声明枚举类型
enum Day//星期
{
Mon,
Tues,
Wed,
Thur,
Fri,
Sat,
Sun
};
enum Sex//性别
{
male,
female,
secret
};
enum Color//颜色
{
red,
green,
blue
};
以上定义的enum Day,enum Sex,enum Color都是枚举类型。
{}中的内容是枚举类型的可能取值,也叫枚举常量。
与结构体的区别:
- 结构体的成员是变量,枚举的成员是常量
- 结构体的成员之间用“;”隔开,枚举的成员之间用“,”隔开。
枚举的初始化
枚举的这些可能取值都是有值的,默认从0开始,一次递增1,当然定义的时候可以赋初值。
默认的情形:
enum Color//颜色
{
red,
green,
blue
};
int main()
{
printf("%d\n", red);
printf("%d\n", green);
printf("%d\n", blue);
return 0;
}
输出:
0
1
2
赋初值:
enum Color//颜色
{
red=5,
green=8,
blue
};
int main()
{
printf("%d\n", red);
printf("%d\n", green);
printf("%d\n", blue);
return 0;
}
输出:
5
8
9
3.2枚举的优点
使用#define也可以定义常量,为什么非要使用枚举?
枚举的优点:
- 增加代码的可读性和可维护性。
- 和#define定义的标识符比较,枚举有类型检查,更加严谨。
- 防止了命名污染(封装)。
- 便于调试。
- 使用方便,一次可以定义多个常量。
四、联合(共用体)
4.1联合类型的定义
联合也是一种特殊的自定义类型。
这种类型定义的变量也包含一系列的成员,特征是这些成员共用同一块空间(所以联合也叫共用体)。
联合类型的声明
union Un//关键字 标签
{
char c;
int i;
};
4.2联合的特点
联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合体至少得能保存最大的成员)。
代码1:
union Un
{
char c;
int i;
};
int main()
{
union Un un;
printf("%p\n", &un);
printf("%p\n", &un.i);
printf("%p\n", &un.c);
return 0;
}
输出:
00D7FE44
00D7FE44
00D7FE44
代码2:
union Un
{
char c;
int i;
};
int main()
{
union Un un;
un.i = 0x11223344;
un.c = 0x55;
printf("%x\n", un.i);
printf("%d\n", sizeof(un));
return 0;
}
输出:
11223355
4
了解了联合的特点之后。我们可以利用联合的特点来判断,机器是小端存储还是大端存储?
回忆一下,之前我们是怎么判断的?
int main()
{
int i = 1;
int ret = *(char*)(&i);
//取i的地址,强制转换为char*,再解引用,访问第一个字节的内容
if (ret == 1)
printf("小端存储");
else
printf("大端存储");
return 0;
}
输出:
小端存储
利用联合的特点判断:
union Un
{
char c;
int i;
};
int main()
{
union Un un;
un.i = 1;
int ret = un.c;
if (ret == 1)
printf("小端存储");
else
printf("大端存储");
return 0;
}
输出:
小端存储
4.3联合大小的计算
-
联合的大小至少是最大成员的大小。
-
当最大成员的大小不是最大对齐数的整数倍时,就要对齐到最大对齐数的整数倍。
例:
union U
{
char c [5];
int i;
}u;
union S
{
short d [5];
int j;
}s;
int main()
{
printf("%d\n", sizeof(u));
printf("%d\n", sizeof(s));
return 0;
}
输出:
8
12
解释:
char c [5]的对齐数为1,int i的对齐数为4。
最大对齐数为4,u的大小应该是4的倍数,5不是4的倍数,应该再补3个字节(或者开辟空间的时候多开辟3个字节),使u的大小为8才行。
short d [5]的对齐数为2,int j的对齐数为4。
最大对齐数为4,s的大小应该是4的倍数,10不是4的倍数,应该再补2个字节(或者开辟空间的时候多开辟2个字节),使s的大小为12才行。