一、基于I/O复用的服务器端
这部分内容讨论的是并发服务器实现方法的延伸。
1.1 多进程服务器端的缺点和解决方法
为了构建并发服务器,只要有客户端连接请求就会创建新进程。这的确是实际操作中采用的一种方案,但并非十全十美,因为创建进程时需要付出极大代价。这需要大量的运算和内存空间,由于每个进程都具有独立的内存空间,所以相互间的数据交换也要求采用相对复杂的方法(IPC属于相对复杂的通信方法)。现在我们面临的一个问题就是:“能否在不创建进程的同时向多个客户端提供服务?”本节介绍的I/O复用就是这种技术。
1.2 理解复用
复用的含义可以如下理解:
“为了提高物理设备的效率,用最少的物理要素传递最多数据时采用的技术”
下面进行解释,图12-1给出了一个纸杯电话:
上图是远距离的3人可以同时通话的3方对话纸杯电话系统。另外,为了完成3人对话,说话时需同时对着两个纸杯,接听时也需要耳朵同时对准两个纸杯。此时引入复用技术会使通话更加方便,如图12-2所示:
观察上图,可以发现复用技术的优点如下:
- 减少连线长度
- 减小纸杯个数
即使减少了连线和纸杯的量仍能进行3人通话,当然也有人考虑如下这种情况:
“好像不能同时说话?“
实际上,因为是在进行对话,所以很少发生同时说话的情况。也就是说,上述系统采用的是”时分复用技术“。而且,因为说话人声高(频率)不同,即使同时说话也能进行一定程度的区分(当然杂音也随之增多)。因此,也可以说系统同时采用了”频分复用技术“。
1.3 复用技术在服务器端的应用
纸杯电话系统引入复用技术后,可以减少纸杯数和连线长度。同样,服务器端引入复用技术可以减少所需进程数。为便于比较,先给出第10章的多进程服务器端模型,如图12-3所示:
上图的模型中引入复用技术,可以减少进程数。重要的是,无论连接多少客户端,提供服务的进程只有一个:
二、理解select函数并实现服务器端
2.1 select函数的功能和调用顺序
使用select函数时可以将多个文件描述符集中到一起统一监视,监视项目如下:
- 是否存在套接字接收数据?
- 无需阻塞传输数据的套接字有哪些?
- 哪些套接字发生了异常?
注意,上述监视项称为事件(event)。发生监视项对应情况时,称”发生了事件“。这是最常见的表达。
select函数的使用方法与一般函数区别较大,它的调用方法和顺序如图12-5所示:
上图给出了从调用select函数到获取结果所经过程。可以看到,调用select函数前需要一些准备工作,调用后还需查看结果。接下来按照上述顺序进行介绍。
2.2 设置文件描述符
利用select函数可以同时监视多个文件描述符。当然,监视文件描述符可以视为监视套接字。此时首先需要将要监视的文件描述符集中到一起。集中时也要按照监视项(接收、传输、异常)进行区分,即按照上述三种监视项分成三类。
使用fd_set数组变量执行此操作,如图12-6所示。该数据是存有0和1的位数组:
图12-6中最左端的位表示文件描述符0(所在位置)。如果该位设置为1,则表示该文件描述符是监视对象。由上图可以看出,文件描述符1和3是监视对象。
”是否应当通过文件描述符的数字直接将值注册到fd_set变量?“
当然不是!针对fd_set变量的操作是以位为单位进行的,这也意味着直接操作该变量会比较繁琐。实际上,在fd_set变量中注册或更改值的操作都由下列宏完成:
- FD_ZERO(fd_set *fdset):将fd_set变量的所有位初始化为0
- FD_SET(int fd,fd_set *fdset):在参数fdset指向的变量中注册文件描述符fd的信息
- FD_CLR(int fd,fd_set *fdset):从参数fdset指向的变量中清除文件描述符fd的信息
- FD_ISSET(int fd,fd_set *fdset):若参数fdset指向的变量中包含文件描述符fd的信息,则返回真
上述函数中,FD_ISSET用于验证select函数的调用结果。图12-7解释了这些函数的功能:
2.3 设置检查(监视)范围及超时
下面讲解图12-5中步骤一的剩余内容,在此之前先简单介绍下select函数:
#include<sys/select.h>
#include<sys/time.h>
int select(int maxfd, fd_set *readset, fd_set *writeset, fd_set *exceptset, const struct timeval *timeout);
//成功时返回大于0的值,失败时返回-1
- maxfd:监视对象文件描述符数量
- readset:将所有关注”是否存在待读取数据”的文件描述符注册到该fd_set型变量,并传递其地址值
- writeset:将所有关注“是否可传输无阻塞数据”的文件描述符注册到该fd_set型变量,并传递其地址值
- exceptset:将所有关注“是否发生异常”的文件描述符注册到该fd_set型变量,并传递其地址值
- timeout:调用select函数后,为防止陷入无限阻塞的状态,传递超时信息
- 返回值:发生错误时返回-1,超时返回时返回0。因发生关注的事件返回时,返回大于0的值,该值是发生事件的文件描述符数
如上所述,select函数用来验证3种监视项的变化情况。根据监视项我们需要声明3个fd_set型变量,分别向其注册文件描述符信息,并把这3个变量的地址值传递到上述函数的第二到第四个参数。但在调用select函数前需要决定下面2件事:
- 文件描述符的监视(检查)范围是?
- 如何设定select函数的超时事件?
文件描述符的监视范围与select函数的第一个参数有关。select函数通过其第一个参数传递监视对象文件描述符的数量。因此,需要得到注册在fd_set变量中的文件描述符数。当每次新建文件描述符时,其值都会增1,故只需将最大的文件描述符值加1再传递到select函数即可。加1是因为文件描述符的值从0开始。
select函数的超时时间与select函数的最后一个参数有关,其中timeval结构体定义如下:
struct timeval{
long tv_sec; //second
long tv_usec; //microsecond
}
select函数只有在监视的文件描述符发生变化时才返回。如果未发生变化,就会进入阻塞状态。指定超时时间就是为了防止这种情况的发生。通过声明上述结构体变量,将秒填入tv_sec,将毫秒填入tv_usec,然后将结构体的地址值传递到select函数的最后一个参数。此时,即使文件描述符中未发生变化,只要过了指定时间,也可以从函数中返回。不过这种情况下,select函数返回0。因此,可以通过返回值了解返回原因。如果不想设置超时,则传递NULL参数。
2.4 调用select函数后查看结果
在上面介绍了select函数的返回值,如果是大于0的整数,说明有相应数量的文件描述符发生了变化。
注意,文件描述符变化是指监视的文件描述符中发生了相应的监视事件。例如,通过select的第二个参数传递的集合中存在需要读数据的描述符时,就意味着文件描述符发生变化。
select函数返回正整数时,怎么获知哪些文件描述符发生了变化?我们通过向select函数的第二到第四个参数传递的fd_set变量来获知哪些文件描述符发生了变化。以下图为例:
由图12-8可知,select函数调用完成后,向其传递的fd_set变量将发生变化。原来为1的所有位均变为0,但发生变化的文件描述符对应位除外。因此,可以认为值仍为1的位置上的文件描述符发生了变化。
2.5 select函数调用示例
下面通过示例把select函数所有知识点进行整合:
//select.c
#include<stdio.h>
#include<unistd.h>
#include<sys/time.h>
#include<sys/select.h>
#define BUF_SIZE 30
int main(int argc,char *argv[]){
fd_set reads, temps;
int result, str_len;
char buf[BUF_SIZE];
struct timeval timeout;
//接下来的两行初始化fd_set变量并将描述符0对应的位设置为1
//换言之,我们需要监视标准输入(对应文件描述符0)的变化
FD_ZERO(&reads);
FD_SET(0,&reads);
//注意下方被注释的代码,这段代码的作用本意是设置超时,但是不能在这里设置超时,因为
//调用select函数后,结构体timeval的成员tv_sec和tv_usec的值将被替换为超时前剩余时间。
//因此,调用select函数前,每次都需要初始化timeval结构体变量
/*
timeout.tv_sec=5;
timeout.tv_usec=5000;
*/
while(1){
//这里将准备好的fd_set变量reads中的内容拷贝到temps变量,因为调用select
//后,除发生变化的文件描述符对应位外,剩下的所有位将初始化为0。因此,为了记住
//初始值,必须经过这种复制过程。这是使用select函数的通用方法
temps=reads;
//将初始化timeval结构体的代码插入这部分,每次调用select函数前都会初始化新值
timeout.tv_sec=5;
timeout.tv_usec=0;
//调用select函数,如果有控制台输入数据,则返回大于0的整数;如果没有输入数据而引发超时,则返回0
result=select(1,&temps,0,0,&timeout);
if(result==-1){
puts("select() error!");
break;
}
else if(result==0){
puts("Time-out!");
}
else{
//验证发生变化的文件描述符是否为标准输入。若是,则从标准输入读取数据并向控制台输出
if(FD_ISSET(0,&temps)){
str_len=read(0,buf,BUF_SIZE);
buf[str_len]=0;
printf("message from console:%s",buf);
}
}
}
}
运行结果:
2.6 实现I/O复用服务器端
下面通过select函数实现I/O复用服务器端,之前已给出关于select函数的所有说明,下列示例是基于I/O复用的回声服务器端:
//echo_selectserv.c
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<unistd.h>
#include<arpa/inet.h>
#include<sys/socket.h>
#include<sys/time.h>
#include<sys/select.h>
#define BUF_SIZE 100
void error_handling(char *buf);
int main(int argc,char *argv[]){
int serv_sock,clnt_sock;
struct sockaddr_in serv_adr,clnt_adr;
struct timeval timeout;
fd_set reads,cpy_reads;
socklen_t adr_sz;
int fd_max,str_len,fd_num,i;
char buf[BUF_SIZE];
if(argc!=2){
printf("Usage: %s <port> \n",argv[0]);
exit(1);
}
serv_sock=socket(PF_INET,SOCK_STREAM,0);
memset(&serv_adr,0,sizeof(serv_adr));
serv_adr.sin_family=AF_INET;
serv_adr.sin_addr.s_addr=htonl(INADDR_ANY);
serv_adr.sin_port=htons(atoi(argv[1]));
if(bind(serv_sock,(struct sockaddr*)&serv_adr,sizeof(serv_adr))==-1)
error_handling("bind() error");
if(listen(serv_sock,5)==-1)
error_handling("listen() error");
FD_ZERO(&reads);
FD_SET(serv_sock,&reads);
fd_max=serv_sock;
while(1)}{
cpy_reads=reads;
timeout.tv_sec=5;
timeout.tv_usec=5000;
if((fd_num=select(fd_max+1,&cpy_reads,0,0,&timeout))==-1)
break;
if(fd_num==0)
continue;
for(i=0;i<fd_max+1;i++){
if(FD_ISSET(i,&cpy_reads)){
if(i==serv_sock){
adr_sz=sizeof(clnt_adr);
clnt_sock=accept(serv_sock,(struct sockaddr*)&clnt_adr,&adr_sz);
FD_SET(clnt_sock,&reads);
if(fd_max<clnt_sock)
fd_max=clnt_sock;
printf("connected client: %d \n",clnt_sock);
}
else{
str_len=read(i,buf,BUF_SiZE);
if(str_len==0){
FD_CLR(i,&reads);
close(i);
printf("closed client: %d \n",i);
}
else{
write(i,buf,str_len);
}
}
}
}
}
close(erv_sock);
return 0;
}
void error_handling(char *buf){
fputs(buf,stderr);
fputc('\n',stderr);
exit(1);
}