第四章 基本TCP套接字编程
4.1 socket函数
#include <sys/socket.h>
int socket(int family, int type, int protocol); //返回:若成功则为非负描述符,若出错则为-1
- family参数指明协议族
family | 说明 |
AF_INET | IPv4协议 |
AF_INET6 | IPv6协议 |
AF_LOCAL | Unix域协议 |
AF_ROUTE | 路由套接字 |
AF_KEY | 密匙套接字 |
- type指明套接字类型
type | 说明 |
SOCK_STREAM | 字节流套接字 |
SOCK_DGRAM | 数据报套接字 |
SOCK_SEQPACKET | 有序分组套接字 |
SOCK_RAW | 原始套接字 |
-
protocol为某个协议类型常值,或者设为0,已选择所给定family和type组合的系统默认值。
protocol | 说明 |
IPPROTO_TCP | TCP传输协议 |
IPPROTO_UDP | UDP传输协议 |
IPPROTO_SCTP | SCTP传输协议 |
4.2 connect函数
#include <sys/socket.h>
int connect(int sockfd, const struct sockaddr *servaddr, socklen_t addrlen);
//返回:若成功则为0,若出错则为-1
- Sockfd是由socket函数返回的套接字描述符
- Servaddr必须含有服务器IP地址和端口号
客户在调用connect前不必调用bind函数,因为如果需要的话,内核会确定源IP地址,并选择一个临时端口作为源端口。
TCP三路握手过程出错返回可能有以下几种情况:
- (1)若TCP客户没有收到SYN分节的响应,则返回ETIMEDOUT错误。
- (2)若对客户的SYN的响应式RST(表示复位),则表明该服务器主机在我们指定的端口上没有进程在等待与之连接。这是一种硬错误(hard error),客户已接收到RST就马上返回ECONNREFUSED错误。
- RST产生的三个条件:
-
TCP接收到一个根本不存在的连接上的分节。
- TCP想取消一个已有连接
- 目的地为某端口的SYN到达,然而该端口上没有正在监听的服务器
-
- RST产生的三个条件:
- (3)若客户发出的SYN在中间的某个路由器上引发了一个“destination unreachable”ICMP错误,则认为是一个软错误(soft error)。
4.3 bind函数
Bind函数把一个本地协议地址赋予一个套接字。对于网际网协议,协议地址是32位的IPv4地址或128位的IPv6地址与16位的TCP或UDP端口号的组合。
#include <sys/socket.h>
int bind(int sockfd, const struct sockaddr *myaddr, socklen_t addrlen);
//返回:若成功则为0,若出错则为-1
通配地址:
/*IPv4*/
struct sockaddr_in servaddr;
servaddr.sin_addr.a_addr = htonl(INADDR_ANY); /*wildcard*/
/*
对于IPv4,因为其IP地址是一个32位的值,可以用一个简单的数字常值表示
对于IPv6,128的IPv6地址存放在一个结构中,系统预先分配变量in6addr_any并初始化为常值IN6ADDR_ANY_INIT
*/
/*IPv6*/
struct sockaddr_in6 serv;
serv.sin6_addr = in6addr_any; /*wildcard*/
4.4 listen函数
Listen函数仅由TCP服务器调用,它做两件事情:
- (1)当socket函数创建一个套接字时,它被假设为一个主动套接字,也就是说,它是一个将调用connect发起连接的客户套接字。Listen函数把一个未连接的套接字转换成一个被动套接字,指示内核应该接受指向该套接字的连接请求。
- (2)本函数的第二个参数规定了内核应该为相应套接字排队的最大连接个数。
本函数通常应该在调用socket和bind这两个函数之后,并在调用accept函数之前调用。
内核为任何一个给定的监听套接字维护两个队列:
- 未完成连接队列(incomplete connection queue),每个这样的SYN分节对应其中一项:已由某个客户发出并到达服务器,而服务器正在等待完成相应的TCP三路握手过程,这些套接字处于SYN_RCVD状态。
- 已完成连接队列(completed connection queue),每个已完成TCP三路握手过程的客户对应其中一项。这些套接字处于ESTABLISHED状态。
每当在未完成连接队列中创建一项时,来自监听套接字的参数就复制到即将建立的连接中。连接的创建机制是完全自动的,无需服务器进程插手。
当来自客户的SYN到达时,TCP在未完成连接队列中创建一个新项,然后响应以三路握手的第二分节:服务器的SYN响应,其中捎带对客户SYN的ACK。这一项一直保留在未完成连接队列中,直到三路握手的第三个分节(客户对服务器SYN的ACK)到达或者该项超时为止。
如果三路握手正常完成,该项就从未完成连接队列迁移到已完成连接队列的队尾。当进程调用accept时,已完成连接队列中的对头项将返回给进程,或者如果该队列为空,那么进程将被投入睡眠,直到TCP在该队列中放入一项才唤醒它。
4.5 accept函数
accept函数由TCP服务器调用,用于从已完成连接队列对头返回下一个已完成连接。如果已完成连接队列为空,那么进程被投入睡眠(假定套接字为默认的阻塞方式)。
#include <sys/socket.h>
int accept(int sockfd, struct sockaddr *cliaddr,socklen_t *addrlen);
//返回:若成功则为非负描述符,若出错则为-1
参数cliaddr和addrlen用来返回已连接的对端进程(客户)的协议地址。
如果accept成功,那么其返回值是由内核自动生成的一个全新描述符,代表与所返回客户的TCP连接。在讨论accept函数时,我们称它的第一个参数为监听套接字(listening socket)描述符(由socket创建,随后用作bind和listen的第一个参数的描述符),称它的返回值为已连接套接字(connected socket)描述符。
4.6 fork和exec函数
Unix的fork函数是Unix中派生新进程的唯一方法。
#include <unistd.h>
pid_t fork(void);
//返回:在子进程中为0,在父进程中为子进程ID,若出错则为-1
fork返回两次:在调用进程(称为父进程)中返回一次,返回值是新派生进程的进程ID号;在子进程又返回一次,返回值为0。因此返回值本身告知当前进程是子进程还是父进程。
fork在子进程返回0而不是父进程的进程ID的原因在于:任何子进程只有一个父进程,而且子进程总是可以通过调用getppid取得父进程的进程ID。相反,父进程可以有许多子进程,而且无法获取各个子进程的进程ID。如果父进程想要跟踪所有子进程的进程ID,那么它必须记录每次调用fork的返回值。
父进程中调用fork之前打开的所有描述符在fork返回之后由子进程分享。我们将看到网络服务器利用了这个特性:父进程调用accept之后调用fork。所接受的已连接套接字随后就在父进程与子进程之间共享。通常情况下,子进程接着读写这个已连接套接字,父进程则关闭这个已连接套接字。
fork的两个典型用法:
- 一个进程创建一个自身的副本,这样每个副本都可以在另一个副本执行其他任务的同时处理各自的某个操作。这是网络服务器的典型用法。
- 一个进程想要执行另一个程序。既然创建新进程的唯一办法是调用fork,该进程于是首先调用fork创建一个自身的副本,然后其中一个副本(通常为子进程)调用exec把自身替换成新的程序。这是诸如shell之类程序的典型用法。
存放在硬盘上的可执行程序文件能够被Unix执行的唯一方法是:由一个现有进程调用六个exec函数中的某一个。exec把当前进程映像替换成新的程序文件,而且该程序通常从main函数开始执行。进程ID并不改变。我们称调用exec的进程为调用进程(calling process),称新执行的程序为新程序(new program)。
这六个exec函数之间的区别在于:(a)待执行的程序文件是由文件名(filename)还是由路径名(pathname)指定;(b)新程序的参数是一一列出还是由一个指针数组来引用;(c)把调用进程的环境传递给新程序还是给新程序指定新的环境。
#include <unistd.h>
int execl(const cahr *pathname, const char *arg0,...);/*(char *)0*/
int execv(const char *pathname, char *const *argv[]);
int execle(const char *pathname, const char *arg0,...
/*(char *)0,char *const envp[]*/);
int execve (const char *pathname,char *const argv[], char *const envp[]);
int execlp(const char *filename, const char *arg0,.../*(char *)0*/);
int execvp(const cahr *filename, char *const argv[]);
这些函数只在出错时才返回到调用者。否则,控制将被传递给新程序的起始点,通常就是main函数。
4.7 并发服务器
pid_t pid;
int listenfd,connfd;
listenfd = socket( ... );
bind(listenfd,...);
listen(listenfd,LISTENQ);
for (;;) {
connfd = accept(listenfd,...);
if( (pid = fork()) == 0 ){
close(listenfd);
doit(connfd);
close(connfd);
exit(0);
}
close(connfd);
}
当一个连接建立时,accept返回,服务器接口调用fork,然后由子进程服务客户(通过已连接套接字connfd),父进程则等待另一连接(通过监听套接字listenfd)。既然新的客户由子进程提供服务,父进程就关闭已连接套接字。
Exit:进程终止处理的部分工作就是关闭所有由内核打开的描述符。
之前我们知道对于一个TCP套接字调用close会导致发送一个FIN,随后是正常的TCP连接终止序列。为啥上面的父进程对connfd调用close没有终止它与客户的连接呢?这是因为每个文件或套接字都有一个引用计数。引用计数在文件列表项中维护,它是当前打开着引用该文件或套接字的描述符的个数。上面的代码socket返回后与listenfd关联的文件表项的引用计数值为1。Accept返回后与connfd关联的文件表项的引用计数值也为1,。然而fork返回后,这两个描述符就在父进程与子进程之间共享(也就是被复制),因此与这两个套接字相关联的文件表项各自的访问计数值均为2。这样,当父进程关闭connfd时,它只是把相应的引用计数值从2减为1。该套接字真正的清理和资源释放要等到其引用计数值到达0时才发生。这会在稍后子进程也关闭connfd时发生。
4.8 close函数
Close函数用来关闭套接字,并终止TCP连接。
#include <unistd.h>
int close(int sockfd);
Close一个TCP套接字的默认行为是把该套接字标记为已关闭,然后立即返回到调用程序。该套接字描述符不能再由调用进程使用,也就是说它不能再作为read或write的第一个参数。然而TCP将尝试发送已排队等待发送到对端的任何数据,发送完毕后发生的是正常的TCP连接终止序列。
4.9 getsockname和getpeername函数
#include <sys/socket.h>
//返回与某个套接字关联的本地协议地址
int getsockname(int sockfd, struct sockaddr *localaddr, socklen_t *addrlen);
//返回与某个套接字关联的外地协议地址
int getpeername(int sockfd, struct sockaddr *peeraddr, socklen_t *addrlen);
//均返回:若成功则为0,若出错则为-1
- 在一个没有调用bind的TCP客户上,connect成功返回后,getsockname用于返回由内核赋予该连接的本地IP地址和本地端口号。
- 在以端口号0调用bind(告知内核去选择本地端口号)后,getsockname用于返回由内核赋予的本地端口号。
- 在一个以通配IP地址调用bind的TCP服务器上,与某个客户的连接一旦建立(accept成功返回),getsockname就可以用于返回由内核赋予该连接的本地IP地址。在这样的调用中,套接字描述符参数必须是已连接套接字的描述符,而不是监听套接字的描述符。
- 当一个服务器是由调用过accept的某个进程通过调用exec执行程序时,它能够获取客户身份的唯一途径便是调用getpeername。例如:inetd 的fork并exec某个TCP服务器程序,inetd调用accept返回两个值:已连接套接字描述符connfd,这是函数的返回值;客户的IP地址及端口号,如下图中标有“对端地址”的小方框所示(代表一个网际网套接字地址结构)。Inetd随后调用fork,派生出inetd的一个子进程。既然子进程起始于父进程的内存映像的一个副本,父进程中的那个套接字地址结构在子进程中也可用,那个已连接套接字描述符也是如此(因为描述符在父子进程之间是共享的)。然而当子进程调用exec执行真正的服务器程序(例如Telnet服务器程序)时,子进程的内存映像被替换成新的Telnet服务器的程序文件(也就是说对端地址的那个套接字地址结构就此丢失),不过那个已连接套接字描述符跨exec继续保持开放。Telnet服务器首先调用的函数之一便是getpeername,用于获取客户的IP地址和端口号。