UNIX IPC工具使用总结 里介绍了socket
是一种用于通信的IPC工具。它允许位于同一主机
或跨主机
上的应用程序之间交换数据。第一个被广泛接受的socket API实现于1983年,出现在4.2BSD中,实际上这组API已经被移植到了所有UNIX实现以及大多数操作系统上。
概述
在一个典型的C/S场景中,应用程序使用socket进行通信的方式如下:
- 各个应用程序创建一个socket。socket是一个允许通信的“设备”,两个应用程序都需要用到它。
- 服务器将自己的socket绑定到一个众所周知的地址上,使得客户端能够定位到它的位置。
// 使用socket系统调用,能够创建一个socket,它返回一个用来在后续系统调用中引用该socket的文件描述符
fd = socket(domain, type, protocol);
通信domain
socket存在于一个通信domain中,它确定:
- 识别出一个socket的方法,即,socket“地址”的格式。
- 通信范围,即,在位于同一主机上的应用程序之间,还是位于跨主机的应用程序之间。
现代操作系统至少支持下列domain:
- UNIX(AF_UNIX)domain
允许在同一主机上的应用程序之间进行通信。
POSIX.1g使用
AF_LOCAL
作为AF_UNIX
的同义词,但是SUSv3并没有使用这个名称。
IPv4(AF_INET)domain
允许在使用IPv4
网络连接起来的主机上的应用程序之间进行通信。IPv6(AF_INET6)domain
允许在使用IPv6
网络连接起来的主机上的应用程序之间进行通信。
尽管IPv6被设计成了IPv4的接任者,但目前后一种协议仍然是使用最广的协议。
总结
domain | 执行的通信 | 应用程序间的通信 | 地址格式 | 地址结构 |
---|---|---|---|---|
AF_UNIX | 内核中 | 同一主机 | 路径名 | sockaddr_un |
AF_INET | IPv4 | IPv4连接起来的主机 | 32位IPv4地址 + 16位端口号 | sockaddr_in |
AF_INET6 | IPv6 | IPv6连接起来的主机 | 128位IPv6地址 + 16位端口号 | sockaddr_in6 |
socket类型
每个socket实现都至少提供了两种socket
:流和数据报。这两种socket类型在UNIX和Internet domain中都得到了支持。
属性 | 流 | 数据报 |
---|---|---|
可靠的传递? | YES | NO |
消息边界保留? | NO | YES |
面向连接? | YES | NO |
流socket(SOCK_STREAM)
流socket提供了一个可靠的双向的字节流通信信道
。
可靠的
表示可以保证发送者传输的数据会完整无缺地到达接收应用程序(假设网络连接和接收者都不会崩溃),或收到一个传输失败的通知。双向的
表示数据可以在两个socket之间的任意方向上传输。字节流
表示与管道一样不存在消息边界的概念。
一个
流socket
类似于使用一对允许在两个应用程序之间进行双向通信的管道
,它们之间的差别在于socket(Internet domain)允在在网络上进行通信。
数据报socket(SOCK_DGRAM)
数据报socket允许数据以被称为数据报的消息的形式进行交换。在数据报socket中,消息边界
得到了保留,但是数据传输是不可靠的
,消息的到达可能是无序的,重复的,或者根本就无法达到。
数据报socket是更一般的无连接socket。与流socket不同,一个数据报socket在使用时无需与另一个socket连接。
注意:数据报socket可以与另一个socket连接,但其语义与连接的流socket是不同的。
对比
在Internet domain中:
类型 | 协议 | 名称 |
---|---|---|
流socket | 传输控制协议TCP | TCP socket |
数据报socket | 数据报协议UDP | UDP socket |
socket系统调用
关键的socket系统调用包括:
系统调用 | 描述 |
---|---|
socket() | 创建一个新的socket |
bind() | 将一个socket绑定到一个地址上。通常,服务器需要使用这个调用来将其socket绑定到一个众所周知的地址上,使得客户端能够定位到该socket上。 |
listen() | 允许一个流socket接收来自其他socket的接入连接。 |
accept() | 在一个监听socket上接收来自一个对等应用程序的连接,并可选地返回对等socket的地址。 |
connet() | 建立与另一个socket之间的连接 |
在大多数Linux架构上(除了Alpha和IA-64),所有这些socket系统调用实际上被实现成了通过单个系统调用
socketcall()
进行多路复用的库函数(最初的时候)。但是,上述函数都被称为系统调用,是因为它们在最初的BSD实现,以及其他很多同时代的UNIX实现上,是被作为系统调用实现的。
socket I/O可以使用传统的read()
和write()
系统调用使用,或使用一组socket特有的系统调用,如,send()
,recv()
,sendto()
,recvfrom()
来完成。
注意:在默认情况下,这些系统调用在I/O操作无法被立即完成时会阻塞
。通过使用fcntl()
的F_SETFL
操作来启用O_NONBLOCK
打开文件状态标记可以执行非阻塞I/O。
流socket注意事项
流socket的运作与电话系统类似。具体流程可以参考TCP连接建立和终止及TCP状态转换 。在大多数使用流socket的应用程序中,服务器会执行被动打开,而客户端会执行主动式打开。
#include <sys/socket.h>
// return file descriptor on success, or -1 on error
int socket(int domain, int type, int protocol);
// return 0 on success, or -1 on error
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
// 通用的地址结构(所有domain特定的地址结构模版),用途是,将各种domain特定的地址结构转换成单个类型,以供socket系统调用中的各个参数适用
struct sockaddr {
sa_family_t sa_family; /* Address family (AF_* constant) */
char sa_data[14]; /* Socket address (size varies according to socket domain) */
}
// return 0 on success, or -1 on error
int listen(int sockfd, int backlog);
// return file descriptor on success, or -1 on error
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
// return 0 on success, or -1 on error
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
- socket()接口中,protocol参数通常为0,在裸socket(SOCK_RAW)中,会将protocol指定为IPPROTO_RAW。
从内核2.6.27开始,Linux为type参数提供了第二种用途,即允许两个非标准的标记与socket类型取OR。
除了将一个服务器的socket绑定到一个众所周知的地址,对于一个Internet domain socket来讲,服务器可以不调用bind()而直接调用listen(),这将会导致内核为该socket选择一个
临时端口
。之后服务器可以使用getsockname()
来获取socket的地址。无法在一个已连接的socket(即,已经成功执行connect()的socket,或由accept()返回的socket)上执行listen()。
理解
backlog参数
的用途。
客户端可能会在服务器调用accept()之前调用connect(),这将会产生一个未决的连接。内核必须要记录所有未决的连接请求的相关信息,这样后续的accept()就能够处理这些请求。backlog参数允许
限制
这种未决连接的数量。在这个限制内的连接请求会立即成功,之外的连接请求就会阻塞直到一个未决的连接被accept()接受,并从未决连接队列删除为止。SUSv3规定实现应该通过在
<sys/socket.h>
中定义SOMAXCONN
常量来发布这个限制。在Linux上,这个常量的值被定义为128
。但是,从2.4.25内核起,Linux允许在运行时通过/proc/sys/net/core/somaxconn
文件来调整这个限制。在最初的BSD socket实现中,backlog的上限是5,并且在较早的代码中可以看到这个数值。但是,所有现代实现允许为backlog指定更高的值,这对于使用TCP socket服务大量客户的网络服务器来讲是由必要的。
- accept()通过文件描述符sockfd监听流socket上接受一个接入连接,如果在调用accept()时不存在未决的连接,那么调用就会阻塞直到有连接请求到达为止。传入accept()的剩余参数会返回对端socket的地址。如果不关心对等socket的地址,可以将addr和addrlen分别指定为NULL和0(后续可以通过
getpeername()
)来获取对端的地址。
理解accept的关键:它会创建一个新socket,并且正是这个新socket会与执行connect()的对等socket进行连接。accept()返回的函数结果是已连接的socket的文件描述符。
从内核2.6.28开始,Linux支持一个新的非标准系统调用accept4()
。这个系统调用执行的任务与accept()相同,但是,支持一个额外的参数flags
,而这个参数可以用来改变系统调用的行为。目前系统支持两个标记:SOCK_CLOEXEC
和SOCK_NONBLOCK
。
- 如果connect()失败并且希望重新进行连接,那么SUSv3规定完成这个任务的可移植的方法是关闭这个socket,创建一个新socket,在该新socket上重新进行连接。
数据报socket注意事项
数据报socket的运作类似于邮政系统。
// return number of bytes received, 0 on EOF, or -1 on error
ssize_t recvfrom(int sockfd, void *buffer, size_t length, int flags, struct sockaddr *src_addr, socklen_t *addrlen);
// return number of bytes sent, or -1 on error
ssize_t sendto(int sockfd, const void *buffer, size_t length, int flags, const struct sockaddr *dest_addr, socklen_t addrlen);
不管length的参数值是什么,recvfrom()只会从一个数据报socket中读取一条消息。如果消息的大小超过了length字节,那么消息会被静默地截断为length字节。
在Linux上可以使用sendto()发送长度为0的数据报,但不是所有的UNIX实现都允许这样做。
尽管数据报socket是
无连接的
,但在数据报socket上应用connect()仍然是有效的
。在数据报socket上调用connect()会导致内核记录这个socket()的对等socket的地址。
当一个数据报socket已连接之后:
1. 数据报的发送可在socket上使用write()或send()来完成,与sendto()一样,每个write()会发送一个独立的数据报。
2. 在这个socket上只能读取由对等socket发送的数据报。
- 注意,connect()的作用对数据报socket是
不对称的
。通过再发起一个connect()可以修改一个已连接的数据报socket的对等socket。
总结
为了一个数据报socket设置一个对等socket,这种做法的一个明显优势是在该socket上传输数据时可以使用更简单的I/O系统调用,即,无需使用指定了dest_addr和addrlen参数的sendto(),而只需要使用write()即可。设置一个对等socket主要对那些需要单个对等socket发送多个数据报的应用程序是比较有用的。
在一些TCP/IP实践中,将一个数据报socket连接到一个对等socket能够带来性能上的提升。