C语言开发之联合体用法

最新推荐文章于 2025-02-05 09:56:23 发布

原创最新推荐文章于 2025-02-05 09:56:23 发布 · 1.9k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#语言 #c #数据结构 #office #class #byte

嵌入式Linux C高级开发专栏收录该内容

19 篇文章

订阅专栏

“联合”与“结构”有一些相似之处。但两者有本质上的不同。在结构中各成员有各自的内存空间, 一个结构变量的总长度是各成员长度之和。而在“联合”中,各成员共享一段内存空间, 一个联合变量的长度等于各成员中最长的长度(同样遵循对齐)。应该说明的是, 这里所谓的共享不是指把多个成员同时装入一个联合变量内, 而是指该联合变量可被赋予任一成员值,但每次只能赋一种值, 赋入新值则冲去旧值。

联合体的定义

定义一个联合类型的一般形式为:

union 联合名

{

成员表

};

成员表中含有若干成员,成员的一般形式为: 类型说明符成员名成员名的命名应符合标识符的规定。

例如:

union perdata

{

int class;

char office[10];

};

定义了一个名为perdata的联合类型,它含有两个成员,一个为整型,成员名为class;另一个为字符数组,数组名为office。联合定义之后,即可进行联合变量说明,被说明为perdata类型的变量,可以存放整型量class或存放字符数组office。

联合体成员变量的应用和结构体成员变量的引用很相近，格式为：

联合体变量.成员变量名

从两道经典试题谈联合体（union）的使用

试题一：编写一段程序判断系统中的CPU 是Little endian 还是Big endian 模式？

分析：作为一个计算机相关专业的人，我们应该在计算机组成中都学习过什么叫Little endian 和Big endian。Little endian 和Big endian 是CPU 存放数据的两种不同顺序。对于整型、长整型等数据类型，Big endian 认为第一个字节是最高位字节（按照从低地址到高地址的顺序存放数据的高位字节到低位字节）；而Little endian 则相反，它认为第一个字节是最低位字节（按照从低地址到高地址的顺序存放数据的低位字节到高位字节）。

例如，假设从内存地址0x0000 开始有以下数据：

0x0000	0x0001	0x0002	0x0003
0x12	0x34	0xab	0xcd

如果我们去读取一个地址为0x0000 的四个字节变量，若字节序为big-endian，则读出结果为0x1234abcd；若字节序位little-endian，则读出结果为0xcdab3412。如果我们将0x1234abcd 写入到以0x0000 开始的内存中，则Little endian 和Big endian 模式的存放结果如下：

地址	0x0000	0x0001	0x0002	0x0003
Big-endian	0x12	0x34	0xab	0xcd
Little-endian	0xcd	0xab	0x34	0x12

一般来说，x86 系列CPU 都是little-endian 的字节序，PowerPC 通常是Big endian，还有的CPU 能通过跳线来设置CPU 工作于Little endian 还是Big endian 模式。

解答：显然，解答这个问题的方法只能是将一个字节（CHAR/BYTE 类型）的数据和一个整型数据存放于同样的内存开始地址，通过读取整型数据，分析CHAR/BYTE 数据在整型数据的高位还是低位来判断CPU 工作于Little endian 还是Big endian 模式。得出如下的答案：

typedef unsigned char BYTE;

int main(int argc, char* argv[])

{

unsigned int num,*p;

p = &num;

num = 0;

*(BYTE *)p = 0xff;

if(num == 0xff)

{

printf("The endian of cpu is little\n");

}

else //num == 0xff000000

{

printf("The endian of cpu is big\n");

}

return 0;

}

除了上述方法(通过指针类型强制转换并对整型数据首字节赋值，判断该赋值赋给了高位还是低位)外，还有没有更好的办法呢？我们知道，union 的成员本身就被存放在相同的内存空间（共享内存，正是union 发挥作用、做贡献的去处），因此，我们可以将一个CHAR/BYTE 数据和一个整型数据同时作为一个union 的成员，得出如下答案：

int checkCPU()

{

union w

{

int a;

char b;

} c;

c.a = 1;

return (c.b == 1);

}

试题二：假设网络节点A 和网络节点B 中的通信协议涉及四类报文，报文格式为“报文类型字段+报文内容的结构体”，四个报文内容的结构体类型分别为STRUCTTYPE1~ STRUCTTYPE4，请编写程序以最简单的方式组织一个统一的报文数据结构。

分析：报文的格式为“报文类型+报文内容的结构体”，在真实的通信中，每次只能发四类报文中的一种，我们可以将四类报文的结构体组织为一个union（共享一段内存，但每次有效的只是一种），然后和报文类型字段统一组织成一个报文数据结构。