起源
不知道大家在学习计算机网络协议的时候,有没有这样的疑问,协议的各字段的排序是按照一个什么顺序排序的?比如下面的ipv4协议。按照内存的地址来进行设计的吗?如果是按照内存的地址来设计,计算机数据存储存在大端序和小端序之别,那不是排序不一样?通信中的结构体又如何设计?能够按照各个字段的顺序进行排序设计吗?
在早期的时候,我一直存在一个误区,就是按照内存的从低到高来理解协议,这种理解在大端序系统中不存在问题,但是在小端序的系统中,则对不上。
在网络通信中,为了确保数据通信的一致性,不受通信机器架构的影响,都是采用网络字节序,也即大端序。
所以这里协议的确定的结论是: 大端序的地址来确定协议的,也包括1字节内部的bit顺序。
正因为协议是大端序,所有在不同的操作系统架构下,ipv4头的结构体定义存在差异性,如下:
struct iphdr
{
#if __BYTE_ORDER == __LITTLE_ENDIAN
unsigned int ihl:4;
unsigned int version:4;
#elif __BYTE_ORDER == __BIG_ENDIAN
unsigned int version:4;
unsigned int ihl:4;
#else
# error "Please fix <bits/endian.h>"
#endif
u_int8_t tos;
u_int16_t tot_len;
u_int16_t id;
u_int16_t frag_off;
u_int8_t ttl;
u_int8_t protocol;
u_int16_t check;
u_int32_t saddr;
u_int32_t daddr;
/*The options start here. */
};
大端序的机器结构体定义和协议设计一样,小端序则ipl 与 version 顺序需要换位。
对于TCP协议则相对更复杂一些,其协议头如下:
结构体的定义如下:
struct tcphdr
{
u_int16_t source;
u_int16_t dest;
u_int32_t seq;
u_int32_t ack_seq;
# if __BYTE_ORDER == __LITTLE_ENDIAN
u_int16_t res1:4;
u_int16_t doff:4;
u_int16_t fin:1;
u_int16_t syn:1;
u_int16_t rst:1;
u_int16_t psh:1;
u_int16_t ack:1;
u_int16_t urg:1;
u_int16_t res2:2;
# elif __BYTE_ORDER == __BIG_ENDIAN
u_int16_t doff:4;
u_int16_t res1:4;
u_int16_t res2:2;
u_int16_t urg:1;
u_int16_t ack:1;
u_int16_t psh:1;
u_int16_t rst:1;
u_int16_t syn:1;
u_int16_t fin:1;
# else
# error "Adjust your <bits/endian.h> defines"
# endif
u_int16_t window;
u_int16_t check;
u_int16_t urg_ptr;
};
我们可以看到 从res2-fin 各个bit的顺序也是一样的情况。