socket网络字节序以及大端序小端序

原创 2016年06月02日 08:05:21
不同CPU中,4字节整数1在内存空间的存储方式是不同的。4字节整数1可用2进制表示如下:

00000000 00000000 00000000 00000001

有些CPU以上面的顺序存储到内存,另外一些CPU则以倒序存储,如下所示:

00000001 00000000 00000000 00000000

若不考虑这些就收发数据会发生问题,因为保存顺序的不同意味着对接收数据的解析顺序也不同。

大端序和小端序

CPU向内存保存数据的方式有两种:
  • 大端序(Big Endian):高位字节存放到低位地址(高位字节在前)。
  • 小端序(Little Endian):高位字节存放到高位地址(低位字节在前)。

仅凭描述很难解释清楚,不妨来看一个实例。假设在 0x20 号开始的地址中保存4字节 int 型数据 0x12345678,大端序CPU保存方式如下图所示:

图1:整数 0x12345678 的大端序字节表示

对于大端序,最高位字节 0x12 存放到低位地址,最低位字节 0x78 存放到高位地址。小端序的保存方式如下图所示:

图2:整数 0x12345678 的小端序字节表示

不同CPU保存和解析数据的方式不同(主流的Intel系列CPU为小端序),小端序系统和大端序系统通信时会发生数据解析错误。因此在发送数据前,要将数据转换为统一的格式——网络字节序(Network Byte Order)。网络字节序统一为大端序。

主机A先把数据转换成大端序再进行网络传输,主机B收到数据后先转换为自己的格式再解析。

网络字节序转换函数

在《使用bind()和connect()函数》一节中讲解了 sockaddr_in 结构体,其中就用到了网络字节序转换函数,如下所示:
  1. //创建sockaddr_in结构体变量
  2. struct sockaddr_in serv_addr;
  3. memset(&serv_addr, 0, sizeof(serv_addr)); //每个字节都用0填充
  4. serv_addr.sin_family = AF_INET; //使用IPv4地址
  5. serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); //具体的IP地址
  6. serv_addr.sin_port = htons(1234); //端口号
htons() 用来将当前主机字节序转换为网络字节序,其中h代表主机(host)字节序,n代表网络(network)字节序,s代表short,htons 是 h、to、n、s 的组合,可以理解为”将short型数据从当前主机字节序转换为网络字节序“。

常见的网络字节转换函数有:
  • htons():host to network short,将short类型数据从主机字节序转换为网络字节序。
  • ntohs():network to host short,将short类型数据从网络字节序转换为主机字节序。
  • htonl():host to network long,将long类型数据从主机字节序转换为网络字节序。
  • ntohl():network to host long,将long类型数据从网络字节序转换为主机字节序。

通常,以s为后缀的函数中,s代表2个字节short,因此用于端口号转换;以l为后缀的函数中,l代表4个字节的long,因此用于IP地址转换。

举例说明上述函数的调用过程:
  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <WinSock2.h>
  4. #pragma comment(lib, "ws2_32.lib")
  5. int main(){
  6. unsigned short host_port = 0x1234, net_port;
  7. unsigned long host_addr = 0x12345678, net_addr;
  8. net_port = htons(host_port);
  9. net_addr = htonl(host_addr);
  10. printf("Host ordered port: %#x\n", host_port);
  11. printf("Network ordered port: %#x\n", net_port);
  12. printf("Host ordered address: %#lx\n", host_addr);
  13. printf("Network ordered address: %#lx\n", net_addr);
  14. system("pause");
  15. return 0;
  16. }
运行结果:
Host ordered port: 0x1234
Network ordered port: 0x3412
Host ordered address: 0x12345678
Network ordered address: 0x78563412

另外需要说明的是,sockaddr_in 中保存IP地址的成员为32位整数,而我们熟悉的是点分十进制表示法,例如 127.0.0.1,它是一个字符串,因此为了分配IP地址,需要将字符串转换为4字节整数。

inet_addr() 函数可以完成这种转换。inet_addr() 除了将字符串转换为32位整数,同时还进行网络字节序转换。请看下面的代码:
  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <WinSock2.h>
  4. #pragma comment(lib, "ws2_32.lib")
  5. int main(){
  6. char *addr1 = "1.2.3.4";
  7. char *addr2 = "1.2.3.256";
  8. unsigned long conv_addr = inet_addr(addr1);
  9. if(conv_addr == INADDR_NONE){
  10. puts("Error occured!");
  11. }else{
  12. printf("Network ordered integer addr: %#lx\n", conv_addr);
  13. }
  14. conv_addr = inet_addr(addr2);
  15. if(conv_addr == INADDR_NONE){
  16. puts("Error occured!");
  17. }else{
  18. printf("Network ordered integer addr: %#lx\n", conv_addr);
  19. }
  20. system("pause");
  21. return 0;
  22. }
运行结果:
Network ordered integer addr: 0x4030201
Error occured!

从运行结果可以看出,inet_addr() 不仅可以把IP地址转换为32位整数,还可以检测无效IP地址。

注意:为 sockaddr_in 成员赋值时需要显式地将主机字节序转换为网络字节序,而通过 write()/send() 发送数据时TCP协议会自动转换为网络字节序,不需要再调用相应的函数。
版权声明:本文为芝麻软件工作室原创文章,未经芝麻软件工作室允许不得转载。

相关文章推荐

测试平台大端还是小端(网络字节序和主机字节序)

大端和小端(网络字节序和主机字节序): 大端(Big Endian):即网络字节序。 小端(Littile Endian):即主机字节序。 记忆方式:网络的范围很大,所以大端是网络字节序。 大...

网络字节序和主机字节序详解!!!

我们都知道,如今的通讯方式已经趋向与多样化,异构通信(计算机软件(操作系统) +    计算机硬件(内核架构,ARM,x86)不同)也已经很普遍了,如,手机和电脑中的qq进行通信,,, 同时,在计...

SOCKET 网络字节序与主机字节序及其相互转换

主机字节序:整数在内存中保存的顺序 两种方式: Little endian 将低序字节存储在起始地址 Big endian    将高序字节存储在起始地址 网络字节序:整数在网络中的发...

网络字节序 大端 小端

1.小端法(Little-Endian)就是低位字节排放在内存的低地址端(即该值的起始地址),高位字节排放在内存的高地址端; 2.大端法(Big-Endian)就是高位字节排放在内存的低地址端(即该...

大端小端 && 网络字节序

(0)背景: 网络上的数据流是字节流,对于一个多字节数值,在进行网络传输的时候,先传递哪个字节?也就是说,当接收端收到第一个字节的时候,它是将这个字节作为高位还是低位来处理呢?  (1)网...

[笔试题] 如何判断主机是大端还是小端(字节序)

今天看《linux程序设计》中关于跨平台需要注意的事项,看到了大端小端的问题。突然想起实验室一同学的笔试题,如何判断主机的大端还是小端。         所谓大端就是指高位值在内存中放低位地址,所谓...

《unix网络编程》(6)网络字节序 大端模式和小端模式

大端模式和小端模式的定义 a) Little-Endian就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。 b) Big-Endian就是高位字节排放在内存的低地址端,低位字节排放在内...

网络通信之 字节序转换原理与网络字节序、大端和小端模式

转自:http://www.cnblogs.com/fuchongjundream/p/3914770.html 一、在进行网络通信时是否需要进行字节序转换?       相同字节序的...

大小端模式与网络字节序

一、为什么会出现大小端模式? 不同的cpu采用的大小端模式不一致。X86是小端模式。而KEIL C51则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式...
  • hzhsan
  • hzhsan
  • 2015-06-03 11:18
  • 3292

大端、小端与网络字节序

大端(Big-Endian),小端(Little-Endian)以及网络字节序的概念在编程中经常会遇到,其中网络字节序(Network Byte Order)一般是指大端(Big-Endian,对大部...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)