字节序简单的说,指的就是数据在机器上存储的排序方式,一般分为两种:大字节序(big endian)和小字节序(little endian)。
举个例子:一个2 bytes的数字0x0201存放在我们的系统中,按照数学的理解这个数字的低字节0x01,高字节是0x02,但是如果把这个数字存储到我们的机器上,就会分为两种情况。如果在小字节序的机器上存储,那么低地址处存放的就是0x01,高地址处存放的就是0x02;如果在大字节序的机器上存储,那么低地址处存放的就是0x02,高地址处存放的就是0x01。
小字节序(Little Endian)
DATA:0x0201
总结:低地址存放低位数据
address | data |
---|---|
0x1 | 0x01 |
0x2 | 0x02 |
大字节序(Big Endian)
DATA:0x0201
总结:低地址存放高位数据
address | data |
---|---|
0x1 | 0x02 |
0x2 | 0x01 |
到这里我们已经知道大小字节序的含义了,字节序的支持跟CPU的设计有关,不同架构的CPU可能具有不同的字节序,比如常见的intel芯片,大多是小字节序,而PowerPC架构多是大字节序的芯片。而对于程序开发人员来说,要开发健壮的程序必须要能兼容这两种字节序,这就涉及到通过代码获取系统支持的字节序。
根据前面的介绍,我们可以写一个简单的demo:
#include<stdio.h>
typedef union {
unsigned int num;
unsigned char buf[2];
} un;
int main()
{
un data;
data.num = 0x0201;
if (data.buf[0] == 0x01 && data.buf[1] == 0x02)
printf("This is Little-Endian system!\n");
else if (data.buf[0] == 0x02 && data.buf[1] == 0x01)
printf("This is Big-Endian system!\n");
else
printf("Unknown system!\n");
return 0;
}
在我的机器上的执行结果如下:
xiehaocheng@xiehaocheng:~/work/test/linuxc$ ./endian
This is Little-Endian system!