原文:Beej's Guide to Network Programming
3.2 字节序
国王命令!只有两种字节序,他们是Lame 和Magnificent!
我开玩笑, 但事实就是这样。
事实上计算机存储分为两种:大端(Big-Endian)和小端(Little-Endian)。
不同架构的计算机有不同的主机序,比如Intel80x80的主机字节序是小端。摩托罗拉的68K主机序是大端。还有PowerPC的主机序是…等等!
那我们怎么封装我们的网络字节序呢?
好消息!你不用考虑这些主机字节序细节。我们使用一些函数来处理这些。
好。我们两种类型来转换他们:short(两字节)和long(四字节)。他们都是无符号的。如果你要主机序为short的,我们使用htons()函数。h代表host,n代表network,s表示short。(读作:Host to Network Short)
这多么简单呀…
你能用任何他们的组合(n, h, s),但是你不能使用stolh()函数(Short to Long Host)~~
下面是一些常用的函数:
htons() host to network short
htonl() host to network long
ntohs() network to host short
ntohl() network to host long
3.3 结构体
终于谈到编程了。
在这章,我将谈到被套接字用到的各种数据类型。 因为它们中的一些内容很重要了。
首先是简单的一个:socket描述符。它是下面的类型:
```
int
```
仅仅是一个常见的 int。
从现在起,事情变得不可思议了,而你所需做的就是继续看下去。
注意这样的事实:有两种字节排列顺序:重要的字节 (有时叫"octet",即八位位组) 在前面,或者不重要的字节在前面。
前一种叫“网络字节顺序 (Network Byte Order)”。有些机器在内部是按照这个顺序储存数据,而另外一些则不然。
当我说某数据必须按照 NBO 顺序,那么你要调用函数(例如 htons() )来将它从本机字节顺序 (Host Byte Order) 转换过来。
如果我没有提到 NBO, 那么就让它保持本机字节顺序。
我的第一个结构(在这个技术手册TM中)--struct addrinfo.
这个结构为许多类型的套接字储存套接字提供了首要的信息:
```
struct addrinfo {
int ai_flags; // AI_PASSIVE, AI_CANONNAME, etc.
int ai_family; // AF_INET, AF_INET6, AF_UNSPEC
int ai_socktype; // SOCK_STREAM, SOCK_DGRAM
int ai_protocol; // use 0 for "any"
size_t ai_addrlen; // size of ai_addr in bytes
struct sockaddr *ai_addr; // struct sockaddr_in or _in6
char *ai_canonname; // full canonical hostname
struct addrinfo *ai_next; // linked list, next node
};
```
我们可以使用getaddrinfo()函数获得一个指向该结构的指针。
使用此函数是为了维护IPv4到IPv6的指南。
然而,我们实际使用的结构是structsockaddr.
```
struct sockaddr {
unsigned short sa_family; // address family, AF_xxx
char sa_data[14]; // 14 bytes of protocol address
};
```
sa_family在IPv4是AF_INET,而IPv6是AF_INET6.
sa_data 包含地址(IP)和端口(经过处理的)。
具体到程序员使用的是struct sockaddr_in结构。这个结构是直接映射到struct sockaddr的。
```
// (IPv4 only--see struct sockaddr_in6 for IPv6)
struct sockaddr_in {
short int sin_family; // Address family, AF_INET
unsigned short int sin_port; // Port number
struct in_addr sin_addr; // Internet address
unsigned char sin_zero[8]; // Same size as struct sockaddr
};
```
注意sin_zero可以使用bzero()函数设置。(原文为memset())
sin_port必须使用htons()!
其中struct in_addr的结构声明:
```
// (IPv4 only--see struct in6_addr for IPv6)
// Internet address (a structure for historical reasons)
struct in_addr {
uint32_t s_addr; // that's a 32-bit int (4 bytes)
};
```
它曾经是个最坏的联合,但是现在那些日子过去了。
如果你声明 "ina" 是数据结构struct sockaddr_in 的实例,那么 "ina.sin_addr.s_addr" 就存储4字节的 IP 地址(使用网络字节顺序)。
如果你不幸的系统使用的还是恐怖的struct in_addr ,你还是可以放心4字节的 IP 地址并且和上面我说的一样(这是因为使用了“#define”。)
那关于IPv6的呢?下面就是:
```
// (IPv6 only--see struct sockaddr_in and struct in_addr for IPv4)
struct sockaddr_in6 {
u_int16_t sin6_family; // address family, AF_INET6
u_int16_t sin6_port; // port number, Network Byte Order
u_int32_t sin6_flowinfo; // IPv6 flow information
struct in6_addr sin6_addr; // IPv6 address
u_int32_t sin6_scope_id; // Scope ID
};
struct in6_addr {
unsigned char s6_addr[16]; // IPv6 address
};
```
我们看另外一个简单的结构,struct sockaddr_storage他同时可以在IPv4和IPv6中使用。
```
struct sockaddr_storage {
sa_family_t ss_family; // address family
// all this is padding, implementation specific, ignore it:
char __ss_pad1[_SS_PAD1SIZE];
int64_t __ss_align;
char __ss_pad2[_SS_PAD2SIZE];
};
```
其中ss_family字段请看AF_INET或者AF_INET6(IPv4 or IPv6)。
映射的结构是struct sockaddr_in or struct sockaddr_in6。