一、I/O多路复用的概念
I/O多路复用(IO Multiplexing):IO多路复用模型是建立在内核提供的多路分离函数select基础之上的,使用select函数可以避免同步非阻塞IO模型中轮询等待的问题,此外poll、epoll都是这种模型。在该种模式下,用户首先将需要进行IO操作的socket添加到select中,然后阻塞等待select系统调用返回。当数据到达时,socket被激活,select函数返回。用户线程正式发起read请求,读取数据并继续执行。从流程上来看,使用select函数进行IO请求和同步阻塞模型没有太大的区别,甚至还多了添加监视socket,以及调用select函数的额外操作,效率更差。但是,使用select以后最大的优势是用户可以在一个线程内同时处理多个socket的IO请求。用户可以注册多个socket,然后不断地调用select读取被激活的socket,即可达到在同一个线程内同时处理多个IO请求的目的。而在同步阻塞模型中,必须通过多线程的方式才能达到这个目的。
模型图:
二、select多路复用
select()函数
int select(int max_fd, fd_set *readset, fd_set *writeset, fd_set *exceptset, struct timeval *timeout);
- select函数的返回值是就绪描述符的数目,超时时返回0,出错返回-1;
- 第一个参数max_fd指待测试的fd的总个数,它的值是待测试的最大文件描述符加1。因为当for循环开始遍历fd集合,不管之前集合中有没有存放fd,它都是从0开始,所以第一个参数是所有要监听的文件描述符中最大的+1。
- 中间三个参数readset、writeset和exceptset指定要让内核测试读、写和异常条件的fd集合,如果不需要测试的可以设置为NULL;
- 最后一个参数是设置select的超时时间,如果设置为NULL则永不超时;
设定时间的结构体:
#include <sys/select.h>
#include <sys/time.h>
struct timeval
{
long tv_sec; //seconds
long tv_usec; //microseconds
};
注:
将timeout设置为NULL时,它将永远的等下去;
设置timeval,等待相应的时间;
将timeval设置0,0时,检查描述符会立刻返回;
描述符操作函数
FD_ZERO(fd_set* fds)
FD_SET(int fd, fd_set* fds)
FD_ISSET(int fd, fd_set* fds)
FD_CLR(int fd, fd_set* fds)
FD_ZERO:清空集合;
FD_SET:将给定的描述符加入集合;
FD_ISSET:判断指定描述符是否在集合中,select将更新这个集合,把其中不可读的套节字去掉只保留符合条件的套节字在这个集合里面;
FD_CLR:将指定的描述符从集合中移除;
三,代码示例
在这里我们大概介绍了有关select服务器相关的函数。就直接上代码吧,我们来通过代码来具体的分析select服务器。
流程图:
代码演示:
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>
#include <time.h>
#include <pthread.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <getopt.h>
#include <libgen.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <errno.h>
#include <ctype.h>
#define ARRAY_SIZE(x) (sizeof(x)/sizeof(x[0]))
static inline void msleep(unsigned long ms);
static inline void print_usage(char *progname);
int socket_server_init(char *listen_ip, int listen_port);
int main(int argc, char **argv)
{
int listenfd, connfd;
int serv_port = 0;
int daemon_run = 0;
char *progname = NULL;
int opt;
fd_set rdset;
int rv;
int i, j;
int found;
int maxfd=0;
char buf[1024];
int fds_array[1024];
struct option long_options[] =
{
{"deamon", no_argument, NULL, 'b'},
{"port", required_argument, NULL, 'p'},
{"help", no_argument, NULL, 'h'},
{NULL, 0, NULL, 0}
};
progname = basename(argv[0]);
while((opt = getopt_long(argc, argv, "bp:h", long_options, NULL)) != -1)
{
switch (opt)
{
case 'b':
daemon_run=1;
break;
case 'p':
serv_port = atoi(optarg);
break;
case 'h':
print_usage(progname);
return EXIT_SUCCESS;
default:
break;
}
}
if( !serv_port )
{
print_usage(progname);
return -1;
}
if( (listenfd = socket_server_init(NULL, serv_port)) < 0)
{
printf("ERROR: %s server listen port %d failure\n", argv[0], serv_port);
return -2;
}
printf("%s sever start listen on port %d\n", argv[0], serv_port);
if( daemon_run )
{
daemon_run(0,0);
}
for(i=0; i<ARRAY_SIZE(fds_array) ; i++)
{
fds_array[i]=-1;
}
fds_array[0] = listenfd;
for( ; ; )
{
FD_ZERO(&rdset);
for(i=0; i<ARRAY_SIZE(fds_array) ; i++)
{
if( fds_array[i] < 0)
continue;
maxfd = fds_array[i]>maxfd ? fds_array[i] : maxfd;
FD_SET(fds_array[i], &rdset);
}
rv = select(maxfd+1, &rdset, NULL, NULL, NULL);
if( rv < 0)
{
printf("select failure: %s\n", strerror(errno));
break;
}
else if( rv == 0)
{
printf("select get timeout\n");
continue;
}
if( FD_ISSET(listenfd, &rdset) )
{
if( (connfd=accept(listenfd, (struct sockaddr *)NULL, NULL)) < 0)
{
printf("accept new client failure: %s\n", strerror(errno));
continue;
}
found = 0;
for(i=0; i<ARRAY_SIZE(fds_array); i++)
{
if( fds_array[i] < 0)
connfd);
fds_array[i] = connfd;
found = 1;
break;
}
}
if( !found )
{
printf("accept new client[%d] but full, so refuse it\n", connfd);
close(connfd);
}
}
else
{
for(i=0; i<ARRAY_SIZE(fds_array); i++)
{
if(fds_array[i]<0 || !FD_ISSET(fds_array[i], &rdset))
continue;
if( (rv=read(fds_array[i], buf, sizeof(buf))) <= 0)
{
printf("socket[%d] read failue or get disconnceted.\n",
fds_array[i]);
close(fds_array[i]);
fds_array[i]=-1;
}
else
{
for(j=0; j<rv; j++)
buf[j]=toupper(buf[j]);
if( write(fds_array[i], buf, rv) < 0)
fds_array[i], strerror(errno));
close(fds_array[i]);
fds_array[i]=-1;
}
}
}
}
}
CleanUp:
close(listenfd);
return 0;
}
static inline void msleep(unsigned long ms)
{
struct timeval tv;
tv.tv_sec = ms/1000;
tv.tv_usec = (ms%1000)*1000;
select(0, NULL, NULL, NULL, &tv);
}
static inline void print_usage(char *progname)
{
printf("Usage: %s [OPTION]...\n", progname);
printf("\nMandatory argument to long options are mandatory for short optins too:\n");
printf(" -p[port ] Socket server port address\n");
printf(" -h[help ] Display this help information\n");
printf("\nExample: %s -b -p 8900\n", progname);
return ;
}
int socket_server_init(char *listen_ip, int listen_port)
{
struct sockaddr_in servaddr;
int rv = 0;
int on =1;
int listenfd;
if( (listenfd = socket(AF_INET, SOCK_STREAM, 0)) < 0)
{
printf("Use socket() to create a TCP socket failure:%s\n", strerror(errno));
return -1;
}
setsockopt(listenfd, SOL_SOCKET, SO_REUSEADDR, &on, sizeof(on));
memset(&servaddr, 0, sizeof(servaddr));
servaddr.sin_family = AF_INET;
servaddr.sin_port = htons(listen_port);
if( !listen_ip )
{
servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
}
else
{
if(inet_pton(AF_INET, listen_ip, &servaddr.sin_addr) <= 0)
{
printf("inet_pton() set listen IP adress failure.\n");
rv = -2;
goto CleanUp;
}
}
if(bind(listenfd, (struct sockaddr *)&servaddr, sizeof(servaddr)) < 0)
{
printf("Use bind() to bind the TCP socket failure: %s\n", strerror(errno));
rv = -3;
goto CleanUp;
}
if(listen(listenfd, 13) < 0)
{
printf("Use bind() to bind the TCP socket failure: %s\n", strerror(errno));
goto CleanUp;
}
if(rv<0)
close(listenfd);
else
rv = listenfd;
return rv;
}
代码分析
99 FD_ZERO(&rdset);
100 for(i=0; i<ARRAY_SIZE(fds_array) ; i++)
101 {
102 if( fds_array[i] < 0)
103 continue;
104
105 maxfd = fds_array[i]>maxfd ? fds_array[i] : maxfd;
106 FD_SET(fds_array[i], &rdset);
FD_ZERO将reset集合先清零,用for循环遍历fds_array这个数组,在for循环里的ARRAY()函数,我定义了一个宏:
#define ARRAY_SIZE(x) (sizeof(x)/sizeof(x[0]))
maxfd的赋值是这样计算的:遍历fds_array这个集合时,当存放fds_array中的fd大于maxfd时,就更新这个值,否则就保持原值。FD_SET将选定的描述符放入集合中;
121 if( FD_ISSET(listenfd, &rdset) )
122 {
123 if( (connfd=accept(listenfd, (struct sockaddr *)NULL, NULL)) < 0)
124 {
125 printf("accept new client failure: %s\n", strerror(errno));
126 continue;
127 }
128
129 found = 0;
130 for(i=0; i<ARRAY_SIZE(fds_array); i++)
131 {
132 if( fds_array[i] < 0)
135 {
136 fds_array[i] = connfd;
137 found = 1;
138 break;
139 }
140 }
在此之前已经有select函数进行阻塞,当有新的client连接时,调用FD_ISSET找出是哪一个描述符进行连接,连接成功,产生一个新的fd
将这个fd存入fds_array这个集合中。在后面进行相应的读写操作。
select的缺点
select所能监控的描述符有上限,为1024和__fd_SETSIZE这个宏有关;
select每次都需要将描述符集合拷贝到内核进行监控,设计用户态到内核态之间的数据拷贝;
select在内核中对描述符集合进行轮询遍历,随着描述符增多性能而逐渐下降
select返回时会将所有未就绪描述符移除,所以下次使用又需要重新添加,编码变得更加复杂;
select返回给用户态的集合,并没有告诉用户哪个描述符就绪了,仍需要用户对集合进行轮询判断,随着描述符增多而性能下降;