C语言开发之联合体用法

“联合”与“结构”有一些相似之处。但两者有本质上的不同。在结构中各成员有各自的内存空间, 一个结构变量的总长度是各成员长度之和。而在“联合”中,各成员共享一段内存空间, 一个联合变量的长度等于各成员中最长的长度(同样遵循对齐)。应该说明的是, 这里所谓的共享不是指把多个成员同时装入一个联合变量内, 而是指该联合变量可被赋予任一成员值,但每次只能赋一种值, 赋入新值则冲去旧值。

联合体的定义

定义一个联合类型的一般形式为: 

union 联合名 

成员表 

};

成员表中含有若干成员,成员的一般形式为: 类型说明符成员名 成员名的命名应符合标识符的规定。

 

例如: 

union perdata

{

    int class;

    char office[10];

};

定义了一个名为perdata的联合类型,它含有两个成员,一个为整型,成员名为class;另一个为字符数组,数组名为office。联合定义之后,即可进行联合变量说明,被说明为perdata类型的变量,可以存放整型量class或存放字符数组office。

联合体成员变量的应用和结构体成员变量的引用很相近,格式为:

联合体变量.成员变量名

 

从两道经典试题谈联合体(union)的使用

试题一:编写一段程序判断系统中的CPU Little endian 还是Big endian 模式?

分析:作为一个计算机相关专业的人,我们应该在计算机组成中都学习过什么叫Little endian Big endianLittle endian Big endian CPU 存放数据的两种不同顺序。对于整型、长整型等数据类型,Big endian 认为第一个字节是最高位字节(按照从低地址到高地址的顺序存放数据的高位字节到低位字节);而Little endian 则相反,它认为第一个字节是最低位字节(按照从低地址到高地址的顺序存放数据的低位字节到高位字节)。

例如,假设从内存地址0x0000 开始有以下数据:

 

0x0000

0x0001

0x0002

0x0003

0x12

0x34

0xab

0xcd

 

如果我们去读取一个地址为0x0000 的四个字节变量,若字节序为big-endian,则读出结果为0x1234abcd;若字节序位little-endian,则读出结果为0xcdab3412。如果我们将0x1234abcd 写入到以0x0000 开始的内存中,则Little endian Big endian 模式的存放结果如下:

 

地址

0x0000

0x0001

0x0002

0x0003

Big-endian

0x12

0x34

0xab

0xcd

Little-endian

0xcd

0xab

0x34

0x12

 

一般来说,x86 系列CPU 都是little-endian 的字节序,PowerPC 通常是Big endian,还有的CPU 能通过跳线来设置CPU 工作于Little endian 还是Big endian 模式。

解答:显然,解答这个问题的方法只能是将一个字节(CHAR/BYTE 类型)的数据和一个整型数据存放于同样的内存开始地址,通过读取整型数据,分析CHAR/BYTE 数据在整型数据的高位还是低位来判断CPU 工作于Little endian 还是Big endian 模式。得出如下的答案:

typedef unsigned char BYTE;

int main(int argc, char* argv[])

{

unsigned int num,*p;

p = #

num = 0;

*(BYTE *)p = 0xff;

if(num == 0xff)

{

printf("The endian of cpu is little\n");

}

else    //num == 0xff000000

{

printf("The endian of cpu is big\n");

}

return 0;

}

除了上述方法(通过指针类型强制转换并对整型数据首字节赋值,判断该赋值赋给了高位还是低位)外,还有没有更好的办法呢?我们知道,union 的成员本身就被存放在相同的内存空间(共享内存,正是union 发挥作用、做贡献的去处),因此,我们可以将一个CHAR/BYTE 数据和一个整型数据同时作为一个union 的成员,得出如下答案:

int checkCPU()

{

union w

{

int a;

char b;

} c;

c.a = 1;

return (c.b == 1);

 

}

试题二:假设网络节点A 和网络节点B 中的通信协议涉及四类报文,报文格式为“报文类型字段+报文内容的结构体”,四个报文内容的结构体类型分别为STRUCTTYPE1~ STRUCTTYPE4,请编写程序以最简单的方式组织一个统一的报文数据结构。

分析:报文的格式为“报文类型+报文内容的结构体”,在真实的通信中,每次只能发四类报文中的一种,我们可以将四类报文的结构体组织为一个union(共享一段内存,但每次有效的只是一种),然后和报文类型字段统一组织成一个报文数据结构。

解答:根据上述分析,我们很自然地得出如下答案:

typedef unsigned char BYTE;

//报文内容联合体

typedef union tagPacketContent

{

STRUCTTYPE1 pkt1;

STRUCTTYPE2 pkt2;

STRUCTTYPE3 pkt1;

STRUCTTYPE4 pkt2;

}PacketContent;

//统一的报文数据结构

typedef struct tagPacket

{

BYTE pktType;

PacketContent pktContent;

}Packet;

总结在C/C++程序的编写中,当多个基本数据类型或复合数据结构要占用同一片内存时,我们要使用联合体(试题一是这样的例证);当多种类型,多个对象,多个事物只取其一时(我们姑且通俗地称其为“n 1”),我们也可以使用联合体来发挥其长处(试题二是这样的例证)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值