1.结构体
(1)什么是结构体
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
(2)结构体的声明
声明一个结构体类型
声明一个学生类型 是想通过学生类型创建学生变量(对象)
描述学生: 属性 姓名 电话 性别
#include<stdio.h>
struct Stu//struct结构体关键字 Stu结构体标签
{
//成员变量
char name[20];//名字
char tele[12];//电话
char sex[10];//性别
int age;//年龄
}s4,s5,s6;//全局结构体变量
struct Stu s3;//全局变量
int main()
{
//创建的结构体变量 局部变量
struct Stu s1;
struct Stu s2;
return 0;
}
#include<stdio.h>
struct//匿名结构体
{
int a;
char c;
}sa;
struct//匿名结构体指针
{
int a;
char c;
}*psa;
int main()
{
psa=&sa;//编译器认为两种类型不同
return 0;
}
(3)结构体的自引用
错误:
#include<stdio.h>
struct Node
{
int data;//4
//struct Node n;//自己包含自己不行 类似死递归
stuct Node* next;//4/8
};
int main()
{
sizeof(struct Node);
return 0;
}
#include<stdio.h>
typedef struct
{
int data;//4
Node* next;//4/8
}Node;//还没有定义就使用
int main()
{
struct Node n1;
Node n2;
return 0;
}
正确:
#include<stdio.h>
typedef struct Node
{
int data;//4
struct Node* next;//4/8
}Node;//起名字为Node
int main()
{
struct Node n1;
Node n2;
return 0;
}
(4)结构体变量的定义和初始化
结构体嵌套和输出
#include<stdio.h>
struct T
{
double weight;
short age;
};
struct S
{
char c;
struct T st;
int a;
double d;
char arr[20];
};
int main()
{
//struct S s={'c',100,3.14,"hello bit"};
struct S s={'c',{55.6,30},100,3.14,"hello bit"};
printf("%c %d %lf %s\n",s.c,s.a,s.d,s.arr);
printf("%lf\n",s.st.weight);
return 0;
}
(5)结构体内存对齐
例子:
猜一猜两个输出值为多少?
struct S1
{
char c1;
int a;
char c2;
};
struct S2
{
char c1;
char c2;
int a;
};
int main()
{
struct S1 s1= {0};
printf("%d\n",sizeof(s1));
struct S2 s2= {0};
printf("%d\n",sizeof(s2));
return 0;
}
12和8
为什么就换了个顺序 结果却不一样?
内存对齐规则
1. 第一个成员在与结构体变量偏移量为0的地址处。
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。
VS中默认的值为8
3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
偏移量的解释:
[ ] [ ] [ ] [ ] [ ] [ ] [ ] [ ] [ ] [ ] [ ] [ ] [ ]
第一个框前面的偏移量为0
第二个框前面的偏移量为1
换言之 偏移量的大小就是字节大小
但接下来的访问要从偏移量后面开始
s1:
char
偏移量变为1
int
默认对齐数为8 int为4 取较小值
要对齐到4的整数倍开始访问
所以从偏移量4的位置开始访问
往后走4个字节 也就是4个偏移量
这时偏移量变为8
char
这时偏移量变为9
最后结果是9个字节
但是结构体的整体大小是最大对齐数的整数倍
也就是4的整数倍
所以最后结果是12个字节
s2(与s1同理)
char
偏移量变为1
char
偏移量变为2
int
4和8中取较小值4
所以从偏移量为4处向后访问4个字节
偏移量变为8
所以最后结果是8
结果是4的整数倍
所以最后输出值就为8
练习
#include<stdio.h>
struct S3
{
double d;
char c;
int i;
};
struct S4
{
char c1;
struct S3 s3;
double d;
};
int main()
{
printf("%d\n", sizeof(struct S3));
printf("%d\n", sizeof(struct S4));
return 0;
}
16和32
s3:
double
偏移量变为8
char
偏移量变为9
int
4和8中较小值为4
所以应该从偏移量为12处开始访问4个字节
偏移量最后是16
字节数也为16
是4的倍数
所以最后结果就为16
s4:
char
偏移量变为1
struct
如果出现嵌套
对齐到自己最大对齐数的整数倍
最大对齐数是double 8
所以应该在偏移量为8处开始访问16个字节
所以偏移量变为24
double
从24开始访问8个字节
偏移量最后为32
字节数最后也为32 是8的倍数 最大对齐数的整数倍 要包含内部结构体
所以最后结果就为32
为什么会出现内存对齐?
大部分的参考资料都是如是说的:
1. 平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特 定类型的数据,否则抛出硬件异常。
2. 性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
总体来说:
结构体的内存对齐是拿空间来换取时间的做法。
那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:
让占用空间小的成员尽量集中在一起。
回看例子
当两个char变量在一起时
字节数为8<12
(6)修改默认对齐数
#include<stdio.h>
//设置默认对齐数
#pragma pack(4)
struct S
{
char c1;//1
//7 //3
double d;//8
//16(8) //12(4) //9(1)
};
//取消原始的默认对齐数
#pragma pack()
int main()
{
struct S s;
printf("%d\n",sizeof(s));
}
结构在对齐方式不合适的时候,可以自己更改默认对齐数。
(7)offsetof
offsetof() 得到起始的偏移量 不是偏移之后的
头文件#include<stdddef.h>
#include<stdio.h>
#include<stddef.h>
struct S
{
char c;
int i;
double d;
};
int main()
{
printf("%d\n",offsetof(struct S,c));
printf("%d\n",offsetof(struct S,i));
printf("%d\n",offsetof(struct S,d));
return 0;
}
0 4 8
(8)结构体传参
print1 和 print2 函数哪个好些?
#include<stdio.h>
struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
print2
原因:
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的 下降。
结论:
结构体传参的时候,要传结构体的地址。
2.位段
(1)什么是段位
位段的声明和结位段的声明和结构是类似的,有两个不同:
1.位段的成员int short char 尽量保持类型一致
2.位段的成员名后边有一个冒号和一个数字。
(2)定义和大小计算
//位段-二进制位 节省空间 原本16个字节 现在只要8个字节
struct S
{
int a:2;//2个bit位
int b:5;//5个bit位
int c:10;//10个bit位
int d:30;//30个bit位
//如果大于32会有问题
};
//47bit-6个字节*8-48bit
int main()
{
struct S s;
printf("%d",sizeof(s));
return 0;
}
8
位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
首先开辟4个字节
32bit位
存a b c没有问题 剩下的不够存d 直接不要
再开辟4个字节
存d
所以最后大小为8个字节
(3)位段的内存分配
1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
struct S
{
char a:3;
char b:4;
char c:5;
char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
先将十进制转换成对应的二进制
按位段中相应的bit位存进地址里
存储方式和大小计算一样
存的下就存 存不下丢弃 再开辟新空间
不确定从左向右还是从右向左存
最后写成十六进制
(4)位段的跨平台问题
1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机 器会出问题。
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结:
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。
(5)位段的应用
3.枚举
(1)什么是枚举
把可能的取值一一列举。
(2)定义使用和大小计算
enum Color
{
RED,
GREEN,
BLUE
};
#include<stdio.h>
enum Sex
{
//枚举的可能取值
MALE=2,
FEMALE,
SECRET=8
//MALE,
//FEMALE=9,
//SECRET,
//0 9 10
//可以赋值 常量赋值
};
enum Color
{
RED,
GREEN,
BLUE
};
int main()
{
enum Sex s=MALE;
enum Color c=BLUE;
printf("%d %d %d\n",RED,GREEN,BLUE);
//0 1 2
printf("%d %d %d\n",MALE,FEMALE,SECRET);
//2 3 8
//默认从0开始 依次递增
return 0;
}
如果这样
enum Color c=2;
编译器c没有报错 c++报错
左边枚举 右边int
#include<stdio.h>
enum Sex
{
MALE,
FEMALE,
SECRET
};
int main()
{
enum Sex s=MALE;
printf("%d\n",sizeof(s));
//整型
return 0;
}
4
(3)枚举的优点
我们可以使用 #define 定义常量,为什么非要使用枚举?
枚举的优点:
1. 增加代码的可读性和可维护性
2. 和#define定义的标识符比较枚举有类型检查,更加严谨。
3. 防止了命名污染(封装)
4. 便于调试
5. 使用方便,一次可以定义多个常量
4.联合(共用体)
(1)什么是联合
联合-联合体-共用体-共用同一块空间
(2)定义使用和大小计算
#include<stdio.h>
union Un
{
char c;
int i;
};//都从起始空间往后放
int main()
{
union Un u;
printf("%d\n",sizeof(u));
printf("%p\n",&u);
printf("%p\n",&(u.c));
printf("%p\n",&(u.i));
return 0;
}
4 三个地址结果一样
4:
联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)。
char和int
保证int存下
三个地址结果一样:
共用同一块空间
(3)使用和练习
#include<stdio.h>
union Un1
{
char c[5];
int i;
};
union Un2
{
short c[7];
int i;
};
int main()
{
printf("%d\n", sizeof(union Un1));
printf("%d\n", sizeof(union Un2));
return 0;
}
8和16
联合的大小至少是最大成员的大小。
当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
Un1:
5和4
默认最大对齐数是8
对齐到8
Un2:
14和4
默认最大对齐数是8
对齐到16
#include<stdio.h>
union Un
{
int i;
char c;
};
union Un un;
int main()
{
un.i = 0x11223344;
un.c = 0x55;
printf("%x\n", un.i);
return 0;
}
11223355
十六进制倒着存
44 33 22 11
55 00 00 00
同一块空间
55覆盖了44
打印后正过来
判断当前计算机的大小端存储
1:
指针强制转换实现
#include<stdio.h>
int check_sys()
{
int a=1;
return *(char*)&a;
//返回1 表示大端
//返回0 表示小端
}
int main()
{
int a=1;
int ret=check_sys();
if(1==ret)
{
printf("小端\n");
}
else
{
printf("大端\n");
}
//int a=0x11223344;
//低地址----------------高地址
//[] [] [11] [22] [33] [44] [] [] [] [] 大端字节序存储模式
//[] [] [44] [33] [22] [11] [] [] [] [] 小端字节序存储模式
//讨论一个数据 放在内存中的存放的字节顺序
//大小端字节序问题
}
2:
共用体实现
#include<stdio.h>
int check_sys()
{
union Un//省略Un和u 匿名结构体 只用一次也可以
{
char c;
int i;
}u;
u.i=1;
return u.c;
//共用地址
//返回1 表示大端
//返回0 表示小端
}
int main()
{
int a=1;
int ret=check_sys();
if(1==ret)
{
printf("小端\n");
}
else
{
printf("大端\n");
}
}
i=1
大端:00 00 00 01
小端:01 00 00 00
c和i共用空间
利用u.c只返回1个字节
00(0)就是大端
01(1)就是小端
#11自定义类型#完