结构体与联合体概论
1.结构体的概念与声明
概念:结构体是一组数据的集合。
例如通讯录中的姓名,电话,地址,铃声等数据构成了通讯录的结构体,每个通讯录成员都是一个结构体变量。
结构体的声明:
结构体的关键字是struct
struct binary //结构体类型是struct binary
{
char name[20]; //结构体内部包含了数个成员
int age;
float score;
int haha[3];
};
int main()
{
struct binary lty = { "lty",26,18.5f,{2,3,7} }; //创建结构体变量并对结构体变量赋值
return 0;
}
1.1结构体的类型自定义
typedef struct binary
{
char name[20];
int age;
float score;
int haha[3];
}erciyuan; //将struct binary 重命名为erciyuan
typedef struct binary erciyuan; //这种方法与上面的方法是一样的
1.2结构体变量的访问
结构体有“ . ”,“ -> ”两种访问操作符
“ . ”操作符是对结构体变量名进行访问操作
“ -> ”操作符是对结构体指针进行访问操作
1.3结构体内存对齐
为什么结构体要有内存对齐
1.有些硬件只能访问特定的内存空间
2.如果没有内存对齐,有时候读取数据会变得非常耗时,比如某机器一次从内存中取4个字节,那么地址就只能是4的倍数,如果先创建一个char类型,占用1个字节,然后创建一个int类型的变量,占用4个字节,那么这个int类型的变量有3个字节都在上一个4字节里面,横跨了2个4字节的空间,处理器取出这个int类型变量就需要在2个地址中读取这个变量。
1.3.1结构体内存对齐规则
1.结构体第一个变量从结构体开始地址的0偏移量处开始
2.其他成员变量要对⻬到某个数字(对⻬数)的整数倍的地址处。
对⻬数 = 编译器默认的⼀个对⻬数 与 该成员变量⼤⼩的较⼩值。
VS中默认的值为8
Linux中没有默认对⻬数,对⻬数就是成员⾃⾝的⼤⼩
3.结构体总⼤⼩为最⼤对⻬数(结构体中每个成员变量都有⼀个对⻬数,所有对⻬数中最⼤的)的
整数倍。
4.如果嵌套了结构体的情况,嵌套的结构体成员对⻬到⾃⼰的成员中最⼤对⻬数的整数倍处,结构
体的整体⼤⼩就是所有最⼤对⻬数(含嵌套结构体中成员的对⻬数)的整数倍。
对于这个结构体来说,它在内存中的对齐是这样的
结构体首个元素从0地址偏移处开始,name是是个字符数组,每个元素都是1字节,vs默认对齐数是8,但1比8小,所以对齐数字都是1。
age是int类型,占用4个字节,4与8比较,4小,所以age的对齐偏移地址只能是4的倍数。
score与age相同。
haha数组中,每个元素都是int类型,都要从4的倍数的偏移量处开始,所以,这个结构体大小为20字节。
**为了减少空间占用,我们应该尽量让占用空间小的元素在一起。**↓↓↓↓↓↓↓
struct test1
{
char a;
char b;
int c;
};
struct test2
{
char a;
int b;
char c;
};
int main()
{
printf("%d\n", sizeof(struct test1));
printf("%d\n", sizeof(struct test2));
return 0;
}
上面的两个结构体中的内容相同,但顺序不同,它的大小是这样的
另外,使用 #pragma 预处理命令可以改变默认对齐数(vs默认为8)
test2结构体的对齐数设置为2之后与之前默认对齐数为8时候的对比↓↓↓↓↓↓↓↓
1.4结构体传参的注意事项
结构体传参给函数,可以传地址,也可以传结构体本身,但由于函数传参的时候,会在栈区产生空间,所以传地址可以节省栈区空间
struct test
{
int k;
char m[999];
};
struct test aaa = { 5,"abcdef" };
void abc1(struct test* r)
{
;
}
void abc2(struct test r)
{
;
}
int main()
{
abc1(&aaa); //传结构体的地址
abc2(aaa); //传结构体变量本身
return 0;
}
2.位段
位段是指改变结构体中的单个成员所占空间大小,例如可以将int的32位转换为低4位空间。
位段可使用的类型在c99标准之前只能使用int ,signed int,unsigned int,具体取决于标准的更新与编译环境。
目前其他类型也可以使用位段。
位段可以在一定程度上节省空间,但依然会有浪费的空间存在。
2.1位段的表示方法
struct abc
{
char k : 3; //这个char类型只占用3个bit
int m : 2; //这个int类型只占用2个bit
int e : 1; //这个int类型只占用1个bit
};
struct abc aaa = { 3,1,1};
int main()
{
printf("%d\n", sizeof(aaa)); //aaa的大小为8字节
return 0;
}
在结构体成员后加上 “ :数字 ”。
2.2位段的地址注意事项
因为位段的单位是bit,而通常计算机的地址单位是字节byte(8bit),所以在使用位段的情况下,是不能对结构体变量取地址的。
scanf的参数是指针,所以也不能用scanf对结构体变量直接赋值,所以只能把需要的值存在另一个常规的变量里,然后通过这个常规变量赋值给结构体位段变量。
由于在不同平台和不同编译器里位段的定义都是不统一的,对于内存的使用规则是不统一的,所以如果为了代码可移植性,应该避免位段的使用。
2.3位段的应用
在计算机的通信中,通常会用位段来表示各个数据/地址的传输
在计算机通信中,用位段可以增加通信速度。
3.联合体
联合体的关键字是union,联合体与结构体类似,但联合体中各个成员是共用一块空间的,所以联合体也叫 “ 共用体 ” 。这块空间由联合体成员变量中占用空间最大的变量决定。
union abc //用关键字union创建一个联合体
{
int a;
char b;
};
union abc aaa = {515}; //联合体赋值
int main()
{
printf("%d\n", sizeof(aaa)); //联合体大小为4字节
printf("%d\n", aaa.a); //结果为515 :0000 0000 0000 0000 0000 0010 0000 0011
printf("%d\n", aaa.b); //结果为3 :0000 0011
return 0;
}
3.1联合体判断大小端字节序
union bos
{
char a;
int m;
}abc;
int main()
{
abc.m = 1;
printf("%d\n", abc.a);
return 0;
}
通过调试可以看到,1是存在地地址处的,恰好联合体中的char a也是在低地址处开始的,所以在vs的小端字节序环境下,char a的值是1.