TCP客户端-服务器典型事件
下图是TCP客户端与服务器之间交互的一系列典型事件时间表:
首先启动服务器,等待客户端连接
启动客户端,连接到服务器
客户端发送一个请求给服务器,服务器处理请求,响应客户端
循环步骤3
客户端给服务器发一个文件结束符,关闭客户端连接
服务器也关闭连接
基本TCP客户-服务器程序的套接口函数
套接口编程基本函数
socket 函数
为了执行网络I/O,一个进程(无论是服务端还是客户端)必须做的第一件事情就是调用socket函数。
#include /* basic socket definitions */int socket(int family, int type, int protocol);/* 返回:非负描述字——成功,-1——出错 */
family——协议族
族解释
AF_INETIPv4协议
AF_INET6IPv6协议
AF_LOCALUnix域协议
AF_ROUTE路由套接口
AF_KEY密钥套接口
type——套接口类型
类型解释
SOCK_STREAM字节流套接口
SOCK_DGRAM数据报套接口
SOCK_RAW原始套接口
下面是有效的family和type组合(简略版):
AF_INETAF_INET6
SOCK_STREAMTCPTCP
SOCK_DGRAMUDPUDP
SOCK_RAWIPv4IPv6
socket函数返回一个套接口描述字,简称套接字(sockfd)。获取套接字无需指定地址,只需要指定协议族和套接口类型(如上表中的组合)。
connect函数
TCP客户用connect函数来建立一个与TCP服务器的连接。
#include /* basic socket definitions */int connect(int sockfd,conststruct sockaddr * servaddr, socklen_t addrlen);/* 返回:0——成功,-1——出错 */
参数sockfd便是socket函数返回的套接口描述字。
套接口地址结构servaddr必须包含服务器的IP地址和端口号。
客户端不必非要绑定一个端口(调用bind函数),内核会选择源IP和一个临时端口。
connect函数会触发TCP三次握手。有可能出现下面的错误情况:
1.客户端未收到SYN分节的响应
第一次发出未收到,间隔6s再发一次,再没收到,隔24秒再发一次,总共等待75s还没收到则返回错误( ETIMEDOUT)。可以用时间日期程序验证一下:
查看本地网络信息:
JACKIELUO-MC0:intro jackieluo$ ifconfigen0: flags=8863 mtu1500ether f4:0f:24:2a:72:a6 inet6 fe80::1830:dbd:1b29:2989%en0 prefixlen64secured scopeid0x6inet192.168.0.101netmask0xffffff00broadcast192.168.0.255nd6 options=201 media: autoselect status: active
将程序指向本地地址192.168.0.101(确保时间日期服务器程序已运行),成功:
JACKIELUO-MC0:intro jackieluo$ ./daytimetcpcli192.168.0.101Sat Oct617:06:552018
将程序指向本地子网地址192.168.0.102,其主机ID(102)不存在,等待几分钟后超时返回:
JACKIELUO-MC0:intro jackieluo$ ./daytimetcpcli192.168.0.102connect error: Operation timed out
2.收到RST
即服务器主机在指定端口上没有等待连接的进程,这称为“hard error”,客户端一接收到RST,马上返回错误(ECONNREFUSED)。验证:
关闭之前本机运行的daytimetcpsrv进程
将程序指向本地地址192.168.0.101:
JACKIELUO-MC0:intro jackieluo$ ./daytimetcpcli192.168.0.101connect error: Connection refused
3.发出的SYN在路由器上引发了目的不可达ICMP错误
这个错误被称为“soft error”,最终返回EHOSTUNREACH或者ENETUNREACH。
bind函数
函数bind为套接口分配一个本地协议地址,包括IP地址和端口号。
#include /* basic socket definitions */int bind(int sockfd,conststruct sockaddr * servaddr, socklen_t addrlen);/* 返回:0——成功,-1——出错 */
客户端可以不调用这个函数,由内核选择一个本地ip的临时端口就好。
服务器一般都会调用bind函数绑定ip地址和端口,供客户端调用。一个例外是RPC(远程过程调用)服务器,它由内核为其选择临时端口。然后通过RPC端口映射器进行注册,客户端与该服务器连接之前,先通过端口映射器获取服务器的端口。
进程可以把一个特定的IP地址捆绑到它的套接口上。对于客户端,它发送的请求,源IP地址就是这个地址;对于服务器,如果绑定了IP地址,则只接受目的地为此IP地址的客户连接。
如果服务器不把IP地址绑定到套接口上,那么内核把客户端发送SYN所在分组的目的IP地址作为服务器的源IP地址。(即服务器收到SYN的IP)
给函数bind指定用于捆绑的IP地址和/或端口号的结果:
IP地址端口结果
0内核选择IP地址和端口
非0内核选择IP地址,进程指定端口
本地IP地址0进程选择IP地址,内核指定端口
本地IP地址非0进程选择IP地址和端口
listen函数
函数listen仅被TCP服务器调用。
#include /* basic socket definitions */int listen(int sockfd, int backlog);/* 返回:0——成功,-1——出错 */
调用函数socket函数创建的套接口,默认是主动方,下一步应是调用connect,CLOSED的下一个状态是SYN_SENT(见TCP状态转换图)。而函数listen将套接口转换成被动方,告诉内核,应接受指向此套接口的连接请求,CLOSED状态变成LISTEN。
函数listen的第二个参数backlog表示内核为此套接口排队的最大连接数。对于给定的监听套接口,内核会维护两个队列:
未完成连接队列(incomplete connection queue) SYN分节已由客户发出,到达服务器,正在进行TCP的三路握手。此时这些套接口处于SYN_RCVD状态。
已完成连接队列(completed connection queue) SYN分节已由客户发出,到达服务器,并且已完成三路握手。此时这些套接口处于ESTABLISHED状态。
当来自客户的SYN到达时,TCP在未完成连接队列中创建一个新条目,直到三路握手中,第三个分节(客户对服务SYN的ACK)到达,这个条目移到已完成连接队列的队尾。
当进程调用accept函数时,已完成连接队列的头部条目返回给进程。
两个队列之和不能超过backlog
当一个客户SYN到达时,若这两个队列都是满的,TCP就忽略此分节,且不发送RST。客户TCP将重发SYN,期望不久就能在队列中找到空闲位置。
TCP为监听套接口维护的两个队列
accept函数
函数accept由TCP服务器调用,从已完成连接队列头部返回下一个已完成连接,若该队列为空,则进程睡眠(假定套接口为默认的阻塞方式)。
#include /* basic socket definitions */int accept(int sockfd, struct sockaddr *cliaddr, socklen_t *addrlen);/* 返回:非负描述字——成功,-1——出错 */
函数accept的第一个参数和返回值都是套接口描述字。其中,
第一个参数,称为监听套接口描述字,即由函数socket返回,也用于bind,listen的第一个参数。
返回值,称为已连接套接口描述字。
通常一个服务器,只生成一个监听套接口描述字,直到其关闭。而内核为每个被接受的客户连接,创建一个已连接套接口,当客户连接完成时,关闭该已连接套接口。
注意到intro/daytimetcpsrv.c中,后两个参数传的都是空指针,这是因为我们不关注客户的身份,无需知道客户的协议地址。
connfd = Accept(listenfd, (SA *) NULL, NULL);
稍作修改,不再传入空指针,见intro/daytimetcpsrv1.c:
socklen_t len;struct sockaddr_in servaddr, cliaddr;...connfd = Accept(listenfd, (SA *) &cliaddr, &len);printf("connection from %s, port %d\n", Inet_ntop(AF_INET, &cliaddr.sin_addr, buff, sizeof(buff)), ntohs(cliaddr.sin_port));
kill掉之前的daytimetcpsrv进程:
$ sudo lsof -i -P | grep -i"listen"daytimetc80986root3u IPv40xae12d925e45287930t0 TCP *:13(LISTEN)$ sudo kill-980986
编译运行新的服务端程序:
$ make daytimetcpsrv1.c daytimetcpsrv1
$ ./daytimetcpsrv1
重复执行客户端程序,发几个请求:
$ ./daytimetcpcli127.0.0.1Wed Sep2614:11:202018$ ./daytimetcpcli127.0.0.1Wed Sep2614:17:062018
查看服务端打印:
connectionfrom127.0.0.1, port58201connectionfrom127.0.0.1, port58342
注意到,由于客户端程序没有调用bind函数,内核为它的协议地址选择了源ip作为IP地址,临时端口号也发生了变化。
fork和exec函数
#include pid_t fork(void);/* 返回:在子进程中为0,在父进程中为子进程ID,-1——出错 */
fork函数调用一次,却返回两次。
在调用它的进程(即父进程),它返回一次,返回值是派生出来的子进程的进程ID。 父进程可能有很多子进程,必须通过返回值跟踪记录子进程ID。
在子进程,它还返回一次,返回值为0。 子进程只有一个父进程,总可以通过getppid来得到父进程的ID
通过返回值可以判断当前进程是子进程还是父进程。
父进程在调用fork之前打开的所有描述字在函数fork返回后都是共享的。网络服务器会利用这一特性:
父进程调用accept。
父进程调用fork,已连接套接口就在父进程与子进程间共享。(一般来说就是子进程读、写已连接套接口,而父进程关闭已连接套接口)。
fork有两个典型应用:
一个进程为自己派生一个拷贝,并发执行任务,这也是典型的并发网络服务器模型。
一个进程想执行其他的程序,于是调用fork生成一个拷贝,利用子进程调用exec来执行新的程序。典型应用是shell。
以文件形式存储在硬盘上的可执行程序若要被执行,需要由一个现有进程调用exec函数。我们将调用exec的进程称为调用进程,新程序的进程ID并不改变,仍处于当前进程。
小结
客户和服务器,从调用socket开始,返回一个套接口描述字。客户调用connect,服务器调用bind、listen、accept。最后套接口由close关闭。
多数TCP服务器是调用fork来实现并发处理多客户请求的。多数UDP服务器则是迭代的。
欢迎工作一到八年的Java工程师朋友们加入Java高级交流群:854630135
本群提供免费的学习指导 架构资料 以及免费的解答
不懂得问题都可以在本群提出来 之后还会有直播平台和讲师直接交流噢
哦对了,喜欢就别忘了关注一下哦~