「内存分配」大端小端详解

  • 大端小端是计算机系统内存存储的两种模式,可谓是如雷贯耳的存在了。
  • 我本以为自己已经是完全明白了,然而有时碰到的时候却发现概念有些混淆,一旦遇到复杂的场景就不知所措了。
  • 所以写下此篇博客记录心路历程。

一、概念

首先给出两者的概念:

  • 大端:数据的高位,保存在内存的低地址中。
  • 小端:数据的低位,保存在内存的低地址中。

先不管它们的区别,那么为什么要引入大小端?

  • 内存是以字节为单位存储的,每个地址空间是一个字节,8bit。
  • 然后,比如说在C语言中,char是1个字节、8bit,short是16bit,int是32bit。
  • 如果仅仅是char,是8bit,刚好和内存中的地址空间对应不需要区分。
  • 但是如果是int,32bit,这4个字节的排列问题就需要使用大小端来区分了。

好了,既然大小端是存在,那么我们如何区分大小端,它们到底是如何分割的?以我的编译器为例,已知我的电脑是小端(具体如何得到的后面会给出例子),给出如下代码:

#include <iostream>
using namespace std;

int main()
{
    int a = 0x12345678;
    printf("a = %p\n", a);
    char* p = (char *)&a;//char型指针指向a的首地址
    printf("内存:%p %p %p %p\n", p, p + 1, p + 2, p + 3);
    printf("值:%p %p %p %p\n", *p, *(p + 1), *(p + 2), *(p + 3));
    
    system("pause");
    return 0;
}

结果:
在这里插入图片描述
通过指针操作,8bit的指针p指向a的首地址,而后打印出p、p+1、p+2、p+3指向的int型变量a的四个字节。

可以看到,地址从低到高,其中的值分别为0x78 0x56 0x34 0x12,也就是说,数据低地址的0x78出现在内存低地址的位置,按照定义,这就是小端模式。

注意:a = 0x12345678,所以78属于数据的低地址。

二、求系统大端还是小端

2.1 思路如上例

上面的例子给了我们很好的思路,我们给出一个大于8bit的变量,然后用一个8bit的指针指向该变量的第一个字节,看其值如何判断大端小端。

#include <iostream>
using namespace std;

int main()
{
    int a = 0x12345678;
    char* p = (char *)&a;
    if (*p == 0x78)
    {
        printf("小端!\n");
    }
    else
    {
        printf("大端!\n");
    }

    system("pause");
    return 0;
}

结果自然是:小端。

2.2 共用体

C语言中有这么一类数据结构:类似于结构体,是用户自定义数据结构,但是它很特殊。即共用体将几种不同类型的变量存放到同一段内存单元中。
在这里插入图片描述
char和int在内存中占的字节数不同,但都从同一地址开始存放,也就是几个变量相互覆盖。

#include <iostream>
using namespace std;

union s
{
    int a;
    char c[3];
};

int main()
{
    s a = {1};//定义一个共用体,初始值为1
    printf("大小:%d\n", sizeof(a));
    printf("%p %p %p %p\n", (char*)&a.a, (char*)&a.a + 1, (char*)&a.a + 2, (char*)&a.a + 3);
    printf("%p %p %p\n", (char*)&a.c[0], (char*)&a.c[1], (char*)&a.c[2]);
    
    system("pause");
    return 0;
}

结果:
在这里插入图片描述
可以看到,共用体的内存大小是联合体中最长成员的长度,且各变量的地址是一致,也就是重复的。

联合体取值

#include <iostream>
using namespace std;

union s
{
    int a;
    char c[3];
};

int main()
{
    s a = {-2};//定义一个共用体,初始值为1
    printf("大小:%d\n", sizeof(a));
    printf("a = %d\n", a.a);
    printf("c[0]~c[2]:%d %d %d\n", a.c[0], a.c[1], a.c[2]);
    
    system("pause");
    return 0;
}

在这里插入图片描述
这里涉及到一个问题,也就是负数在内存中是以补码的形式存储的,-2的存储方式为:

  • -2的原码:0x00000002
  • -2的反码:0xfffffffd
  • -2的补码:0xfffffffe

在内存中,以小端模式存储,从低地址到高地址:0xfe 0xff 0xff 0xff,而0xff以8bit形式其实就是-1,0xfe则是-2。所以c[0]、c[1]、c[2]分别为:-2、-1、-1。

如果a = 128,结果:
在这里插入图片描述
因为有符号8bit的范围是-128~127,128的二进制为0b10000000,其补码还是0b10000000,然后再在前一加上-,就是-128了。

共用体判断大小端

前面我们在已经知道是在小端的情况下,那么如何用共用体判断大小端?

#include <iostream>
using namespace std;

union s
{
    short a;
    char c;
};

int main()
{
    s a = {1};//定义一个共用体,初始值为1
    if (a.c == 1)
    {
        printf("小端!\n");
    }
    else
    {
        printf("大端!\n");
    }

    system("pause");
    return 0;
}

在这里插入图片描述
就是利用联合体,所有变量共用同一起始地址,所以处于数据低地址的1如果也处于内存的低地址,那就是小端,反之为大端。

三、总结

总而言之,小端:数据的低地址存储在内存的低地址,比如int型变量,0x12345678,地址从低往高四个字节:0x78、0x56、0x34、0x12。大端则反之。
在这里插入图片描述


关于大端小端的知识整理完毕,又水了一篇博客~
觉得不错的一键三连支持哦~~~
在这里插入图片描述

  • 16
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 14
    评论
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

暗夜无风

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值