#以下内容全部摘自UNIX网络编程 卷1:套接字联网API(第3版)
套接字地址结构
大多数套接字函数都需要一个指向套接字地址结构的指针作为参数。每个协议族都定义它
自己的套接字地址结构。这些结构的名字均已sockaddr_
开头,并以对应每个协议族的唯一后缀结尾。
IPv4套接字地址结构
IPv4套接字地址结构通常也称为“网际套接字地址结构”,它以sockaddr_in
命名,定义在<netinet/in.h>
头文件中。
下面给出了它的POSIX
定义。
struct in_addr {
in_addr_t s_addr; /* 32-bit IPv4 address */
/* network byte ordered */
};
struct sockaddr_in {
uint8_t sin_len; /* length of structure (16) */
sa_family_t sin_family; /* AF_INET */
in_port_t sin_port; /* 16-bit TCP or UDP port number */
/* network byte ordered */
struct in_addr sin_addr /* 32-bit IPv4 address */
/* network byte ordered */
char sin_zero[8]; /* unused */
};
32位IPv4地址存在两种不同的访问方法。举例来说,如果serv
定义为某个网际套接字地址结构,
那么serv.sin_addr
将按in_addr
结构引用其中的32位IPv4地址,而serv.sin_addr.s_addr
将按
in_addr_t
(通常是一个无符号的32位整数)引用同一个32位IPv4地址。因此,我们必须正确地
使用IPv4地址,尤其是在将它作为函数的参数时,因为编译器对传递结构和传递整数的处理是完全不同的。
sin_zero
字段未曾使用,不过在填写这种套接字地址结构时,我们总把该字段置为0。按照惯例,我们
总是在填写前把整个结构置为0,而不是单单把sin_zero
字段置为0.
尽管多数使用该结构的情况不要求这一字段为0,但是当捆绑一个非通配的IPv4地址时,该字段必须为0。
套接字地址结构仅在给定主机上使用:虽然结构中的某些字段(例如IP地址和端口号)用在不同主机之间的通信中,
但是结构本身并不在主机之间传递。
通用套接字地址结构
当作为一个参数传递进任何套接字函数时,套接字地址结构总是以引用形式(也就是以指向该结构的指针)来传递。
然而以这样的指针作为参数之一的任何套接字函数必须处理来自所有支持的任何协议族的套接字地址结构。
在<sys/socket.h>
头文件中定义一个通用的套接字地址结构
struct sockaddr {
uint8_t sa_len; /* address family: AF_xxx value */
sa_family_t sa_family; /* protocol-specific address */
char sa_data[14];
};
于是套接字函数被定义为以指向某个通用套接字地址结构的一个指针作为其参数之一,这正如bind
函数的ANSI C
函数原型所示:
int bind(int, struct sockaddr *, socklen_t);
这就要求对这些函数的任何调用都必须要将指向特定于协议的套接字地址结构的指针进行类型强制转换(casting),
变成指向某个通用套接字地址结构的指针,例如:
struct sockaddr_in serv; /* IPv4 socket address structure */
/* fill in serv{} */
bind(sockfd, (struct sockaddr *) &serv, sizeof(serv));
如果我们省略了其中的类型强制转换部分“(struct sockaddr *)”,并假设系统的头文件中有bind
函数的一个
ANSI C
原型,那么C编译器就会产生这样的警告信息:”warning:passing arg 2 of ‘bind’ from incompatible pointer type.“
(警告:把不兼容的指针类型传递给’bind’函数的第二个参数。)
IPv6套接字地址结构
IPv6套接字地址结构在<netinet/in.h>
头文件中定义
struct in6_addr {
unit8_t s6_addr[16]; /* 128-bit IPv6 address */
/* network byte ordered */
};
#defien SIN6_LEN /* required for compile-time tests */
struct sockaddr_in6 {
uint8_t sin6_len; /* length of this struct (28) */
sa_family_t sin6_family; /* AF_INET6 */
in_port_t sin6_port; /* transport layer port# */
/* network byte ordered */
uint32_t sin6_flowinfo; /* flow information, undefined */
struct in6_addr sin6_addr; /* IPv6 address */
/* network byte ordered */
uint32_t sin6_scope_id; /* set of interfaces for a scope */
};
对于该结构体定义要注意一下几点
- 如果系统支持套接字地址结构的长度字段,那么
SIN6_LEN
常值必须定义。 - IPv6的地址族是
AF_INET6
,而IPv4的地址族是AF_INET
。 - 结构中字段的先后顺序做过编排,使得如果
sockaddr_in6
结构本身是64位对齐的,那么128位的sin6_addr
字段也是64位对齐的。在一些64位处理机上,如果64位数据存储在某个64位边界位置,那么对它的访问将得到优化处理。 sin6_flowinfo
字段分成两个字段:
- 低序20位是流标(flow lable);
- 高序12位保留。
- 流标字段随图A-2讲解。它的使用仍然是一个研究课题。
- 对于具备范围的地址(
scoped address
),sin6_scope_id
字段标识其范围(scope),最常见的是
链路局部地址(link-local address)的接口索引(interface index)(见A.5节)。
新的通用套接字地址结构
作为IPv6套接字API的一部分而定义的新的通用套接字地址结构克服了现有struct sockaddr
的一些缺点。
不像struct sockaddr
,新的struct sockaddr_storage
足以容纳系统所支持的任何套接字地址结构。
sockaddr_storage
结构在<netinet/in.h>
头文件中定义。
struct sockaddr_storage {
uint8_t ss_len; /* length of this struct (implementation dependent) */
sa_family_t ss_family; /* address family: AF_xxx value */
/* implementation-dependent elements to provide:
* a) alignment sufficient to fulfill the alignment requirements of
* all socket address types that the system supports.
* b) enough storage to hold any type of socket address that the
* system supports.
*/
};
sockaddr_storage
类型提供的通用套接字地址结构相比sockaddr
存在一下两点差别。
1. 如果系统支持的任何套接字地址结构有对齐需要,那么sockaddr_storage
能够满足最苛刻的要求。
2. sockaddr_storage
足够大,能够容纳系统支持的任何套接字地址结构。
注意,除了ss_family
和ss_len
外(如果有的话),sockaddr_storage
结构中的其他字段对于
用户来说是透明的。sockaddr_storage
结构必须类型强制转换或复制到适合于ss_family
字段
所给出地址类型的套接字地址结构中,才能访问其他字段。
套接字地址结构的比较
sockaddr_un
结构本身并非长度可变的,但是其中的信息(即结构中的路径名)却是长度可变的。
当传递指向这些结构的指针时,我们必须小心处理长度字段,包括套接字地址结构本身的长度
字段(如果其实现支持此字段),以及作为参数传给内核或从内核返回的长度。
值-结果参数
我们提到过,当往一个套接字函数传递一个套接字地址结构时,该结构总是以引用形式来传递,
也就是说传递的是指向该结构的一个指针。该结构的长度也作为一个参数来传递,不过其传递方式取决于
该结构的传递方向:是从进程到内核,还是从内核到进程。
* 从进程到内核传递套接字地址结构的函数有3个:bind
、connect
和sendto
。这些函数的一个参数是指向
某个套接字地址结构的指针,另一个参数是该结构的整数大小,例如:
struct sockaddr_in serv;
/* fill in serv{} */
connect (sockfd, (SA *) &serv, sizeof(serv));
既然指针和指针所指内容的大小都传递给了内核,于是内核知道到底需从进程复制多少数据进来。
套接字地址结构大小的数据类型实际上是socklen_t
,而不是int
,不过POSIX
规范建议将
socklen_t
定义为uint32_t
。
* 从内核到进程传递套接字地址结构的函数有4个:accept
、recvfrom
、getsockname
和getpeername
。
这4个函数的其中两个参数是指向某个套接字地址结构的指针和指向表示该结构大小的整数变量的指针。例如:
struct sockaddr_un cli; /* Unix domain */
socklen_t len;
len = sizeof(cli); /* len is a value */
getpeername(unixfd, (SA *) &cli, &len);
/* len may have changed */
把套接字地址结构大小这个参数从一个整数改为指向某个整数变量的指针,其原因在于:当函数被调用时,
结构大小时一个值(value),它告诉内核该结构的大小,这样内核在写该结构时不至于越界;当函数返回时,
结构大小又是一个结果(result),它告诉进程内核在该结构中究竟存储了多少信息。这种类型的参数称为
值-结果(value-result)参数。
当使用值-结果参数作为套接字地址结构的长度时,如果套接字地址结构是固定长度的,那么从内核返回的值总是
那个固定长度,例如IPv4的sockaddr_in
长度是16,IPv6的sockaddr_in6
长度是28。然而对于可变长度的套接字
地址结构(例如Unix域的sockaddr_un
),返回值可能小于该结构的最大长度。
2