- 大端小端是计算机系统内存存储的两种模式,可谓是如雷贯耳的存在了。
- 我本以为自己已经是完全明白了,然而有时碰到的时候却发现概念有些混淆,一旦遇到复杂的场景就不知所措了。
- 所以写下此篇博客记录心路历程。
一、概念
首先给出两者的概念:
- 大端:数据的高位,保存在内存的低地址中。
- 小端:数据的低位,保存在内存的低地址中。
先不管它们的区别,那么为什么要引入大小端?
- 内存是以字节为单位存储的,每个地址空间是一个字节,8bit。
- 然后,比如说在C语言中,char是1个字节、8bit,short是16bit,int是32bit。
- 如果仅仅是char,是8bit,刚好和内存中的地址空间对应不需要区分。
- 但是如果是int,32bit,这4个字节的排列问题就需要使用大小端来区分了。
好了,既然大小端是存在,那么我们如何区分大小端,它们到底是如何分割的?以我的编译器为例,已知我的电脑是小端(具体如何得到的后面会给出例子),给出如下代码:
#include <iostream>
using namespace std;
int main()
{
int a = 0x12345678;
printf("a = %p\n", a);
char* p = (char *)&a;//char型指针指向a的首地址
printf("内存:%p %p %p %p\n", p, p + 1, p + 2, p + 3);
printf("值:%p %p %p %p\n", *p, *(p + 1), *(p + 2), *(p + 3));
system("pause");
return 0;
}
结果:
通过指针操作,8bit的指针p
指向a的首地址,而后打印出p、p+1、p+2、p+3
指向的int型变量a的四个字节。
可以看到,地址从低到高,其中的值分别为0x78 0x56 0x34 0x12,也就是说,数据低地址的0x78出现在内存低地址的位置,按照定义,这就是小端模式。
注意:a = 0x12345678
,所以78属于数据的低地址。
二、求系统大端还是小端
2.1 思路如上例
上面的例子给了我们很好的思路,我们给出一个大于8bit的变量,然后用一个8bit的指针指向该变量的第一个字节,看其值如何判断大端小端。
#include <iostream>
using namespace std;
int main()
{
int a = 0x12345678;
char* p = (char *)&a;
if (*p == 0x78)
{
printf("小端!\n");
}
else
{
printf("大端!\n");
}
system("pause");
return 0;
}
结果自然是:小端。
2.2 共用体
C语言中有这么一类数据结构:类似于结构体,是用户自定义数据结构,但是它很特殊。即共用体将几种不同类型的变量存放到同一段内存单元中。
char和int在内存中占的字节数不同,但都从同一地址开始存放,也就是几个变量相互覆盖。
#include <iostream>
using namespace std;
union s
{
int a;
char c[3];
};
int main()
{
s a = {1};//定义一个共用体,初始值为1
printf("大小:%d\n", sizeof(a));
printf("%p %p %p %p\n", (char*)&a.a, (char*)&a.a + 1, (char*)&a.a + 2, (char*)&a.a + 3);
printf("%p %p %p\n", (char*)&a.c[0], (char*)&a.c[1], (char*)&a.c[2]);
system("pause");
return 0;
}
结果:
可以看到,共用体的内存大小是联合体中最长成员的长度,且各变量的地址是一致,也就是重复的。
联合体取值
#include <iostream>
using namespace std;
union s
{
int a;
char c[3];
};
int main()
{
s a = {-2};//定义一个共用体,初始值为1
printf("大小:%d\n", sizeof(a));
printf("a = %d\n", a.a);
printf("c[0]~c[2]:%d %d %d\n", a.c[0], a.c[1], a.c[2]);
system("pause");
return 0;
}
这里涉及到一个问题,也就是负数在内存中是以补码的形式存储的,-2的存储方式为:
- -2的原码:0x00000002
- -2的反码:0xfffffffd
- -2的补码:0xfffffffe
在内存中,以小端模式存储,从低地址到高地址:0xfe 0xff 0xff 0xff,而0xff以8bit形式其实就是-1,0xfe则是-2。所以c[0]、c[1]、c[2]分别为:-2、-1、-1。
如果a = 128,结果:
因为有符号8bit的范围是-128~127,128的二进制为0b10000000,其补码还是0b10000000,然后再在前一加上-
,就是-128了。
共用体判断大小端
前面我们在已经知道是在小端的情况下,那么如何用共用体判断大小端?
#include <iostream>
using namespace std;
union s
{
short a;
char c;
};
int main()
{
s a = {1};//定义一个共用体,初始值为1
if (a.c == 1)
{
printf("小端!\n");
}
else
{
printf("大端!\n");
}
system("pause");
return 0;
}
就是利用联合体,所有变量共用同一起始地址,所以处于数据低地址的1如果也处于内存的低地址,那就是小端,反之为大端。
三、总结
总而言之,小端:数据的低地址存储在内存的低地址,比如int型变量,0x12345678,地址从低往高四个字节:0x78、0x56、0x34、0x12。大端则反之。
关于大端小端的知识整理完毕,又水了一篇博客~
觉得不错的一键三连支持哦~~~