「内存分配」大端小端详解

最新推荐文章于 2024-04-29 12:43:37 发布

暗夜无风

最新推荐文章于 2024-04-29 12:43:37 发布

阅读量2.2k

点赞数 16

分类专栏： C/C++ 文章标签： c语言指针大端小端内存分配

本文链接：https://blog.csdn.net/aruewds/article/details/118605442

版权

C/C++ 专栏收录该内容

11 篇文章 16 订阅

订阅专栏

大端小端是计算机系统内存存储的两种模式，可谓是如雷贯耳的存在了。
我本以为自己已经是完全明白了，然而有时碰到的时候却发现概念有些混淆，一旦遇到复杂的场景就不知所措了。
所以写下此篇博客记录心路历程。

一、概念

首先给出两者的概念：

大端：数据的高位，保存在内存的低地址中。
小端：数据的低位，保存在内存的低地址中。

先不管它们的区别，那么为什么要引入大小端？

内存是以字节为单位存储的，每个地址空间是一个字节，8bit。
然后，比如说在C语言中，char是1个字节、8bit，short是16bit，int是32bit。
如果仅仅是char，是8bit，刚好和内存中的地址空间对应不需要区分。
但是如果是int，32bit，这4个字节的排列问题就需要使用大小端来区分了。

好了，既然大小端是存在，那么我们如何区分大小端，它们到底是如何分割的？以我的编译器为例，已知我的电脑是小端（具体如何得到的后面会给出例子），给出如下代码：

#include <iostream>
using namespace std;

int main()
{
    int a = 0x12345678;
    printf("a = %p\n", a);
    char* p = (char *)&a;//char型指针指向a的首地址
    printf("内存：%p %p %p %p\n", p, p + 1, p + 2, p + 3);
    printf("值：%p %p %p %p\n", *p, *(p + 1), *(p + 2), *(p + 3));
    
    system("pause");
    return 0;
}

结果：
在这里插入图片描述
通过指针操作，8bit的指针p指向a的首地址，而后打印出p、p+1、p+2、p+3指向的int型变量a的四个字节。

可以看到，地址从低到高，其中的值分别为0x78 0x56 0x34 0x12，也就是说，数据低地址的0x78出现在内存低地址的位置，按照定义，这就是小端模式。

注意：a = 0x12345678，所以78属于数据的低地址。

二、求系统大端还是小端

2.1 思路如上例

上面的例子给了我们很好的思路，我们给出一个大于8bit的变量，然后用一个8bit的指针指向该变量的第一个字节，看其值如何判断大端小端。

#include <iostream>
using namespace std;

int main()
{
    int a = 0x12345678;
    char* p = (char *)&a;
    if (*p == 0x78)
    {
        printf("小端！\n");
    }
    else
    {
        printf("大端！\n");
    }

    system("pause");
    return 0;
}

结果自然是：小端。

2.2 共用体

C语言中有这么一类数据结构：类似于结构体，是用户自定义数据结构，但是它很特殊。即共用体将几种不同类型的变量存放到同一段内存单元中。
在这里插入图片描述
char和int在内存中占的字节数不同，但都从同一地址开始存放，也就是几个变量相互覆盖。

#include <iostream>
using namespace std;

union s
{
    int a;
    char c[3];
};

int main()
{
    s a = {1};//定义一个共用体，初始值为1
    printf("大小：%d\n", sizeof(a));
    printf("%p %p %p %p\n", (char*)&a.a, (char*)&a.a + 1, (char*)&a.a + 2, (char*)&a.a + 3);
    printf("%p %p %p\n", (char*)&a.c[0], (char*)&a.c[1], (char*)&a.c[2]);
    
    system("pause");
    return 0;
}

结果：
在这里插入图片描述
可以看到，共用体的内存大小是联合体中最长成员的长度，且各变量的地址是一致，也就是重复的。

联合体取值

#include <iostream>
using namespace std;

union s
{
    int a;
    char c[3];
};

int main()
{
    s a = {-2};//定义一个共用体，初始值为1
    printf("大小：%d\n", sizeof(a));
    printf("a = %d\n", a.a);
    printf("c[0]~c[2]：%d %d %d\n", a.c[0], a.c[1], a.c[2]);
    
    system("pause");
    return 0;
}

在这里插入图片描述
这里涉及到一个问题，也就是负数在内存中是以补码的形式存储的，-2的存储方式为：

-2的原码：0x00000002
-2的反码：0xfffffffd
-2的补码：0xfffffffe

在内存中，以小端模式存储，从低地址到高地址：0xfe 0xff 0xff 0xff，而0xff以8bit形式其实就是-1,0xfe则是-2。所以c[0]、c[1]、c[2]分别为：-2、-1、-1。

如果a = 128，结果：
在这里插入图片描述
因为有符号8bit的范围是-128~127,128的二进制为0b10000000，其补码还是0b10000000，然后再在前一加上-，就是-128了。

共用体判断大小端

前面我们在已经知道是在小端的情况下，那么如何用共用体判断大小端？

#include <iostream>
using namespace std;

union s
{
    short a;
    char c;
};

int main()
{
    s a = {1};//定义一个共用体，初始值为1
    if (a.c == 1)
    {
        printf("小端!\n");
    }
    else
    {
        printf("大端!\n");
    }

    system("pause");
    return 0;
}

在这里插入图片描述
就是利用联合体，所有变量共用同一起始地址，所以处于数据低地址的1如果也处于内存的低地址，那就是小端，反之为大端。

三、总结

总而言之，小端：数据的低地址存储在内存的低地址，比如int型变量，0x12345678，地址从低往高四个字节：0x78、0x56、0x34、0x12。大端则反之。
在这里插入图片描述

关于大端小端的知识整理完毕，又水了一篇博客~
觉得不错的一键三连支持哦~~~
在这里插入图片描述

暗夜无风

关注

16
点赞
踩
22

收藏

觉得还不错? 一键收藏
打赏
14
评论
「内存分配」大端小端详解

大端小端是计算机系统内存存储的两种模式，可谓是如雷贯耳的存在了。我本以为自己已经是完全明白了，然而有时碰到的时候却发现概念有些混淆，一旦遇到复杂的场景就不知所措了。所以写下此篇博客记录心路历程。目录一、概念二、求系统大端还是小端2.1 思路如上例2.2 共用体联合体取值共用体判断大小端三、总结一、概念首先给出两者的概念：大端：数据的高位，保存在内存的低地址中。小端：数据的低位，保存在内存的低地址中。先不管它们的区别，那么为什么要引入大小端？内存是以字节为单位存储的，每个地址空..
复制链接

扫一扫