【C语言】共用体union与大小端模式

最新推荐文章于 2024-07-23 17:06:25 发布

Baymaxly

最新推荐文章于 2024-07-23 17:06:25 发布

阅读量1.8k

点赞数 2

分类专栏： C语言文章标签： c语言内存管理数据结构指针

本文链接：https://blog.csdn.net/weixin_43955214/article/details/104218105

版权

C语言专栏收录该内容

23 篇文章 4 订阅

订阅专栏

一、共用体union

1.1 共用体的定义、变量定义和使用

共用体union和结构体struct在类型定义、变量定义和使用方法上很相似，如下代码段

#include <stdio.h>
typedef union myunion1
{
    int a;
    char b;
}MU1;

int main(void)
{
    MU1 test1;
    test1.a = 1;
    printf("test1.a = %d\n", test1.a);
    return 0;
}

1.2 共用体和结构体的不同

结构体中的成员彼此是独立存在的，分布在不同的内存单元中
共用体重的成员是“一体的”，使用同一个内存单元

1.2.1 测试代码

#include <stdio.h>

typedef union myunion1
{
    int a;
    char b;
}MU1;

typedef union myunion2
{
    int a;
    char b;
    char c[9];
}MU2;

int main(void)
{
    MU1 union1;
    union1.a = 65;
    //测试大小
    printf("sizeof(MU1) = %lu\n", sizeof(MU1));
    printf("sizeof(MU2) = %lu\n", sizeof(MU2));
    //测试成员变量地址
    printf("&union1    = %p\n", &union1);
    printf("&union1.a  = %p\n", &union1.a);
    printf("&union1.b  = %p\n", &union1.b);
    //测试成员变量的值
    printf("union1.a  = %d\n", union1.a);
    printf("union1.b  = %c\n", union1.b);
    return 0;
}

1.2.2 测试结果

1.2.3 结果分析

共用体整体采用的是4字节对齐，里面的成员变量共用一块内存空间，起始地址均为共用体的首地址
共用体的长度由其最长的成员变量结合整体4字节对齐共同决定，如下图所示
我们知道，字符'A'的ASCII码为65，这也印证了共用体union就是对同一块内存中存储的二进制的不同解析方式

1.3 指针方式访问共用体实现不同解析方式

我们知道共用体的所有成员变量的首地址都是在一起的，这省去了计算各成员变量地址的麻烦，在指针访问时，我们只需要结合不同解析方式对指针类型进行变换即可

1.3.1 测试代码

#include <stdio.h>

typedef union myunion1
{
    int a;
    char b;
}MU1;

int main(void)
{
    MU1 union1;
    union1.a = 65;
    printf("*((int *) &union1) = %d\n", *((int *) &union1));
    printf("*((char *)&union1) = %c\n", *((char *)&union1));
    return 0;
}

1.3.2 测试结果

这个也非常好理解，我们只是将MU1 *类型的指针强制转换成了我们所期待的指针类型然后再进行解引用。

二、大小端模式

2.1 大小端模式简述

2.1.1 大小端问题的由来

在通信系统中，如果要通过串口发送一个12345678H给接收方，但是串口只能以字节为单位来发送，需要发4次；接收方分4次接收，内容分别是：12H、34H、56H、78H。接收方接收到这4个字节之后需要去重组得到12345678H（而不是得到0x78563412），因而在通信双方需要有一个协议，就是：先发/先接的是高位还是低位？这就是通信中的大小端问题

2.1.2 计算机中存储系统的大小端

C语言中除了有8bit的char型，也有16bit的short型，还有32bit的int型(据具体的编译环境而定），但是在计算机存储系统中数据仍然是按照字节为单位的。于是一个16/32/64位的二进制数据在存储时有2种分布方式：

大端模式(big endian) :数据的高字节保存在内存的低地址，低字节保存在高地址
小端模式(little endian):数据的高字节保存在内存的高地址，低字节保存在低地址

如下图所示，将数据12345678H存入内存中：

大端模式和小端模式没有优劣之别，由于小端模式将地址的高低和数据位权结合起来了(高地址部分权值高，低地址部分权值低)，导致主流用小端(Intel、ARM)，但是也有些CPU公司用大端(如C51)，所以要求必须存储时和读取时按照同样的大小端模式来进行，否则会出错。

2.2 用函数测试计算机的大小端存储

我们知道，如果将一个int型(32bit)的数据存入内存中，需要占4B的空间，而char型的数据只占1B。那么，如果我们将int类型的数据存入内存中，而用char去解析他，只会得到其中的一部分数据。如2.1.2中的12345678H，如果用char去解析，在小端模式下得到的是78H，而在大端模式下得到的是12H。

那么我们将int类型的1存入内存中用char解析会怎么样呢？

很显然：

在大端模式下得到的是00H，也就是0
在小端模式下得到的是01H，也就是1

2.2.1 共用体实现

#include <stdio.h>

enum MyStatus{BIG = 0, LITTLE};

typedef union BIG_OR_LITTLE_ENDIAN
{
    int a;
    char b;
}BOLE;

int endian_test(void);

int main(void)
{
    int result = endian_test();
    printf(result == BIG ? "大端模式\n" : "小端模式\n");
    return 0;
}

int endian_test(void)
{
    BOLE test;
    test.a = 1;
    return test.b;
}

在小端模式下的测试结果(Intel i5-8300H)

在大端模式下的调试结果(Keil C51，AT89C52)，我们可以看到断点处result的值是0，说明确实处于大端模式下

2.2.2 指针实现

#include <stdio.h>

enum MyStatus{BIG = 0, LITTLE};

int endian_test(void);

int main(void)
{
    int result = endian_test();
    printf(result == BIG ? "大端模式\n" : "小端模式\n");
    return 0;
}

int endian_test(void)
{
    int test = 1;
    return *((char *)&test);
}