在网络编程中,分为主机字节序和网络字节序。字节序分为大端和小端问题。网络字节序约定以大端为主,而主机就没有这样的约定,在Windows、Linux、Mac等主机上可能就是大小端的其中一种。
例如有这样一个十六进制数字0x12345678,它占了4个字节,每个字节8位,两个16进制占8位(一个16进制为24 ,两个16进制为28 )。这个高字节位是最让人迷惑的地方,比如上面这个数,高字节位就是挨着0x的两个16进制数,牢牢记住就行了,至于它存在大小端的哪里,那是大小端的事,只需要记住高字节位在哪里就OK了。
大端模式(高字节位存放在内存低地址中)
低地址 ——————————> 高地址
0x12 | 0x34 | 0x56 | 0x78
小端模式(高字节位存放在内存高地址中)
低地址 ——————————> 高地址
0x78 | 0x56 | 0x34 | 0x12
判断大小端简单事例
#include <stdio.h>
int main(int argc, char const *argv[])
{
union {
short s;
char c[sizeof(short)];
}un;
un.s=0x1234;
if (sizeof(short)==2)
{
if (un.c[0]==0x12&&un.c[1]==0x34)
{
printf("Big Endian\n");
}
else if (un.c[0]==0x34&&un.c[1]==0x12)
{
printf("Little Endian\n");
}
else
{
printf("unknown\n");
}
}else
{
printf("sizeof(short) is %ld\n",sizeof(short));
}
return 0;
}
在套接字网络编程时,可按照主机字节序存储套接字结构中的各个字段,等到这些字段和协议首部相应字段间移动时,在主机字节序和网络字节序之前转换。POSIX规定,套接字地址结构体中必须以网络字节序进行维护,并且提供了相互转换的函数。
#include <netinet/in.h>
uint16_t htons(uint16_t host16bitvalue);
uint32_t htonl(uint32_t host32bitvalue); //以上两个返回网络字节序的值
uint16_t ntohs(uint16_t net16bitvalue);
uint32_t ntohl(uint32_t net32bitvalue); //以上两个放回主机字节序的值
函数名中,h代表host,n代表network,s代表short,l代表long 。现在我们把s视为一个16进制是值,可以转化TCP或者UDP的端口号,把l视为一个32位的值,可以转化IPv4地址的值,但是不能转化IPv6的值,IPv6地址的网络字节序为128位。
我们并不关心主机主机字节序是大端还是小端,关于程序的健壮性,都应该用这四个函数转化一下,如果机器是大端,那么这四个函数被定义为空宏,不做任何处理。如果是小端就转化一下。
总结!