1. 字节序
先上图,帮助理解
假设图 1中在内存 0x1000到 0x1003这连续的 4个字节保存了数据,这段数据对应的数据类型是 int类型。我们知道 int类型的数据在大多数编译器实现中都是 4字节。
那么图 1中这个 int 类型数据,到底是 0x10203040还是 0x40302010?实际上这是依赖于处理器架构的。
对于 little-endian(小端)机器来说,这 4字节数据被解释成 int类型的话它就是 0x10203040,对于big-endian (大端)机器来说,它被解释成0x40302010.
小端的意思就是说,数据的低位(低字节)保存在内存的低地址部分,数据的高位(高字节)保存在内存的高地址部分。按照这个规则,对于小端机器来说,高地址 0x1003 这个位置保存的是数据最高位,0x1000这个地址保存的是数据的最低位,所以最终的 int类型数据就是 0x10203040.
大部分情况下,我们的使用都是小端机器,Intel处理器和 AMD 处理器基本上都是小端的。但是也有一些处理器是大端的。
2. 网络字节序
为了能让不同处理器架构的机器进行通信,他们都需要将本机上的字节序转换成网络字节序,这样就解决了不同处理器之间的矛盾。
一般来说,网络字节序和大端机器上的字节序是一样的。
POSIX 提供了 4 个函数(也可能是用宏来实现的),可以让本机字节序和网络字节序之间进行互转。它们分别是:
#include <arpa/inet.h>
uint32_t htonl(uint32_t hostlong);
uint16_t htons(uint16_t hostshort);
uint32_t ntohl(uint32_t netlong);
uint16_t ntohs(uint16_t netshort);
其中,函数名字中的 h表示 host(本机),n表示 network(网络),而l 表示要转换的数据是4 字节,s表示要转换的数据是 2字节。
我们可通过实验来验证自己的机器是大端和小端的,另外网络字节序又是什么样的。
3. 实验
程序 htonl.c打印整型数据 0x10203040在内存中的样子,然后将其转换成网络字节序后,再打印其在内存中的样子。
//实验:将本机字节序转换为网络字节序
#include <stdio.h>
#include <arpa/inet.h>
#include <stdlib.h>
union Int
{
char data[4];
int x;
};
int main()
{
union Int a;
union Int b;
int i;
//本机字节序
a.x = 0x10203040;
//将本机字节序转换为网络字节序
b.x = htonl(a.x);
//打印出本机字节序
//一个整型数据在4个字节的存储地址以及存储内容
printf("a = 0x%08x \n", a.x);
for(i = 0; i < 4;i++)
{
printf("[%p] :%02x \n",a.data+i, a.data[i]);
}
//打印网络字节序
//一个整型数据在4个字节的存储地址以及存储内容
printf("\nb = 0x%08x \n", b.x);
for(i = 0;i < 4;i++)
{
printf("[%p] : %02x \n",b.data+i, b.data[i]);
}
return 0;
}
v 编译和运行
从图 1中可以看到,0x10203040在内存中的样子,低地址保存的是数据低字节,即 0x40,而高地址保存的是数据的高字节,即0x10.
当我们将 0x10203040转换成网络字节序后,在内存中的样子就完全相反了。
4. 知识点总结
v 知道什么是字节序
v 掌握小端和大端的区别
v 为什么会出现网络字节序