IPv4套接字地址结构通常也称为“网际套接字地址结构”,它以sockaddr_in命名,定义在<netinet/in.h>头文件中。
struct in_addr
{
in_addr_t s_addr;/*32-bit IPv4 address*/
/*network byte ordered*/
};
struct sockaddr_in
{
uint8_t sin_len;/*length if structure(16)*/
sa_family_t sin_family;/*AF_INET*/
in_port_t sin_port;/*16-bit TCP or UDP port number*/
/*network byte ordered*/
struct in_addr sin_addr;/*32-bit IPv4 address*/
/*network byte ordered*/
char sin_zero[8]; /*unused*/
};
对套接字地址结构做几点一般性的说明。
1.长度字段sin_len是为了增加对OSI协议的支持而随4.3BSD-Reno添加的。在此之前,第一个成员是sin_family,它是一个无符号短整数(unsigned short)。并不是所有的厂家都支持套接字地址结构的长度字段,而且POSIX规范也不要求有这个成员。该成员的数据类型uint8_t是典型的,符合POSIX的系统都提供这种形式的 数据类型。
正是因为有了长度字段,才简化了长度可变套接字地址结构的处理。
2.即使有长度字段,我们也无须设置和检查它,除非设计路由套接字。它是由处理来自不同协议族的套接字地址结构例程在内核中使用的。
3.POSIX规范只需要这个结构中的3个字段:sin_family、sin_addr和sin_port。对于符合POSIX的实现来说,定义额外的结构字段是可以接受的,这对于网际套接字地址结构来说也是正常的。几乎所有的实现都增加了sin_zero字段,所以所有的套接字地址结构大小都至少是16字节。
4.我们个出字段s_addr、sin_family和sin_port的POSIX数据结构类型。in_addr_t数据类型必须是一个至少32位的无符号整数类型,in_port_t必须是一个至少16位的无符号整数类型,而sa_family_t可以是任何无符号整数类型。在支持长度字段的实现中,sa_family_t通常是一个8位的无符号整数,而在不支持长度字段的实现中,它则是一个16位的无符号整数。
5.我们还将遇到数据类型u_char、u_short、u_int和u_long,它们都是无符号的。POSIX规范定义这些类型时特地标记它们已过时,仅是为向后兼容才提供的。
6.IPv4地址和TCP或UDP端口号在套接字地址结构中总是以网络字节序来存储。在使用这些字段时,我们必须牢记这一点。
7.32位IPv4地址存在两种不用的访问方法。举例来说,如果serv定义为某个网际套接字地址结构,那么serv.sin_addr将按in_addr结构引用其中的32位IPv4地址,而serv.sin_addr.s_addr将按in_addr_t(通常是一个无符号的32位整数)引用同一个32位IPv4地址。因此,我们必须正确地使用IPv4地址,尤其是在将它作为函数的参数时,因为编译器 对传递结构和传递整数的处理是完全不同的。
sin_addr字段是一个结构,而不仅仅是一个in_addr_t类型的无符号长整数,这是有历史原因的。早期的版本(4.2BSD)把in_adddr结构定义为多种结构的联合(union),允许访问一个32位IPv4地址中的所有4个字节,或者访问它的2个16位值。这用在地址被划分成A、B和C三类的时期,便于获取地址中的适当字节。然而随着子网划分技术的来临和无类地址编排的出现,各种地址类正在消失,那个联合已不再需要了。如今大多数系统已经废除了该联合,转而把in_addr定义为仅有一个in_addr_t字段的结构。
8.sin_zero字段未曾使用,不过在填写这种套接字地址结构时,我们总是把该字段置为0.按照惯例,我们总是在填写前把整个结构置为0,而不是单单把sin_zero字段置为0.
尽管多数使用该结构的情况不要求这一字段为0,但是当捆绑一个非通配的IPv4地址时,该字段必须为0
9.套接字地址结构仅在给定主机上使用:虽然结构中的某些字段(例如IP地址和端口号)用在不同主机之间的通信中,但是结构本身不再主机之间传递。
通用套接字地址结构
当作为一个参数传递进任何套接字函数时,套接字地址结构总是以引用形式(也就是以指向该结构的指针)来传递。然而以这样的指针作为参数之一的任何套接字函数必须处理来自所支持的任何协议族的套接字地址结构。
在如何声明所传递指针的数据类型上存在一个问题。有了ANSIC后解决办法很简单:void是通用的指针类型。然而套接字函数是在ANSIC之前定义的,在1982年采取的办法是在<sys/socket.h>头文件中定义一个通用的套接字地址结构,
struct sockaddr
{
uint8_t sa_len;
sa_family_t sa_family;/*address family:AF_xxx value*/
char sa_data[14];/*protocol-specific address*/
}
于是套接字函数被定义为以指向某个通用套接字地址结构的一个指针作为其参数之一,这正如bind函数的ANSIC函数原型所示:
int bind(int,struct sockaddr*,socklen_t);
这就要求对这些函数的任何调用都必须要将指向特定于协议的套接字地址结构的指针进行类型强制转换(casting),变成指向某个通用套接字地址结构的指针,例如:
struct sockaddr_in serv /*IPv4 socket address strcuture*/
/*fill inserv{}*/
bind (sockfd,(struct sockaddr*)&serv,sizeof(serv));
如果我们省略了其中的类型强制转换部分“(struct sockaddr*)”,并假设系统的头文件中有bind函数的ANSIC原型,那么 编译器就会产生这样的警告信息:“warning:passsing arg 2 of bind from incompatible pointer type.”(警告:把不兼容的指针类型传递给“bind”函数的第二个参数。)
从应用程序开发人员的观点看,这些通用套接字地址结构的唯一用途就是对特定于协议的套接字地址结构的指针执行类型强制转换。
IPv6套接字地址结构
IPv6套接字地址结构在<netinet/in.h>头文件中定义,
struct in6_addr
{
unit8_t s6_addr[16];/*128-bit IPv6 address*/
/*network byte ordered*/
};
#define SIN6_LEN/*required for compile-time tests*/
struct sockaddr_in6
{
uint8_t sin6_len;/*length of this struct(28)*/
sa_family_t sin_family;/*AF_INET6*/
in_port_t sin6_port;/*transport layer port*/
/*network byte ordered*/
uint32_t sin6_flowinfo;/*flow information,undefined*/
struct in6_addr sin6_addr;/*IPv6 address*/
/*network byte ordered*/
uint32_t sin6_scope_id /*set of interfaces for a scope*/
};
1.如果系统支持套接字地址结构中的长度字段,那么SIN6_LEN常值必须定义。
2.IPv6的地址族是AF_INET6,而IPv4的地址族是AF_INET。
3.结构中字段的先后顺序做过编排,使得如果是sockaddr_in6结构本身是64位对齐的那么128的sin6_addr字段也是64位对齐的。在一些64位处理机上,如果64 位数据存储在某个64位边界位置,那么对它的访问将得到优化处理。
4.sin6_flowinfo字段分成两个字段:
低序20位是流标(flow label);
高序12位保留。
5.对于具备范围的地址(scoped address),sin6_scope_id字段标识其范围(scope),最常见的是链路局部地址(link-local-address)的套接索引(interface index)
新的通用套接字地址结构
作为IPv6套接字API的一部分而定义的新的通用套接字地址结构克服了现又struct sockaddr 的一些缺点。不像struct sokcaddr,新的struct sockaddr_shortage足以容纳系统所支持的任何套接字地址结构。sockaddr_shorage结构在<netinet/in.h>头文件中定义
struct sockaddr_shorage
{
uint8_t ss_len;/*length of this struct(implementation dependent)*/
sa_family_t ss_family;/*address family:AF_xxx value*/
/*implementation-dependent elements to provide:
a)alignment sufficient to fulfill the alignment requirements of
all socket address types that sysytem supports
b)enough storage to hold any type of socket address that the
system supports*/
};
sockaddr_shorage类型提供的通用套接字地址结构相比sockaddr存在以下两点差别。
(1)如果系统支持的任何套接字地址结构有对齐需要,那么sockaddr_shorage能够满足最苛刻的对齐要求。
(2)sockaddr_shorage足够大,能够容纳系统支持的任何套接字地址结构。
注意,除了ss_family和ss_len外(如果有的话),sockaddr_shorage结构中的其他字段对用户来说是透明。sockaddr_shorage结构必须类型强制转换成或复制到合适于ss_family 字段所给出地址类型的套接字地址结构中,才能够访问其他字段。
套接字地址结构的比较
在上图中,我们对5种套接字地址结构进行了比较IPv4、IPv6、Unix域、数据链路和存储。在该图中,我们假设所有套接字地址结构都包含一个单字节的长度字段,地址族字段也占一个字节,其他所有字段都占用确切的最短长度。
前面两种套接字地址结构是固定长度的,而 Unix域结构和数据链路结构是可变长度的。为了处理长度可变的结构,当我们把指向某个套接字地址结构的指针作为一个参数传递给某个套接字函数时,也把该结构的长度作为另一个参数传递给这个函数。我们在每种长度固定的结构下方给出了这种结构的字节长度
sockaddr_un结构本身并非长度可变的,但是其中的信息(即结构中的路径名)却是长度可变的。当传递指向这些结构的指针时,我们必须小心处理长度字段、包括套接字地址结构本身的长度字段(如果其实现支持此字段),以及作为参数传给内核或从内核返回的长度。