一、select概括
系统提供select函数来实现多路复用输入/输出模型。select系统调用是用来让我们的程序监视多个文件句柄的状态变化的。程序会停在select这里等待,直到被监视的文件句柄有一个或多个发生了状态变化。关于文件句柄,就是一个整数,我们最熟悉的句柄就是 0、1、2三个,0 是标准输出,1 是标准输入,2 是标准错误输出。0、1、2是整数表示的,对应的FILE*结构的表示就是stdio、stdout、stderr。
注意:
1、select的后四个参数为输入/输出型参数,所以在应用的时候需要重新设置 ;
2、fd_set:用来定义文件描述符集 ;
3、readfds:表示读事件;
4、writefds:表示写事件;
5、exceptfds:表示异常事件;
6、参数nfds表示需要监视的最大的文件描述符值+1(基于fd_set)。
rdset、wrset、exset分别对应于需要检测的可读文件描述符的集合,可写文件描述符的集合及异常文件描述符的集合。
struct timeval结构用于描述一段时间长度,如果在这个时间内,需要监视的描述符没有事件发生则函数返回,返回值为0。
1、FD_CLR(int fd, fd_set* set); 用来清除文件描述符集set中的fd位
2、FD_ISSET(int fd, fd_set* set);用来测试文件描述符集set中相关fd的位是否为真(set中的fd位是否有效)
3、FD_SET(int fd, fd_set* set); 用来设置扫描词组set中的相关fd的位
4、FD_ZERO(fd_set* set); 用来清除扫描词组set的全部位
1、参数timeout为结构体timeval,用来设置select()的等待时间。
2、timeout参数的设置:
a、NULL :表示select()没有timeout,select将一直被阻塞,直到某个文件描述符上发生了事件。
b、0 :仅检测描述符集合的状态,然后立即返回,并不等待外部事件的发生。
c、特定的时间值 :如果在指定的时间段里没有事件发生,select将超时返回。
select3种返回值:
1、== 0:表示timeout(设置的时间到了还没有事件发生)
2、< 0 (-1):表示出错了,错误原因存在error,此时参数readfds,writefds,exceptfds和timeout的值变成不可预测。
3、> 0 :执行成功则返回文件描述词状态已改变的个数(就绪fd个数)
二、select、TCP、epoll 服务器的区别与联系
select,poll,epoll都是IO多路复用的机制。I/O多路复用就通过一种机制,可以监视多个描述符,一旦某个描述符就绪(一般是读就绪或者写就绪),能够通知程序进行相应的读写操作。而TCP服务器要想实现多个描述符的等待需要用多进程多线程的方式实现。IO多路复用是指内核一旦发现进程指定的一个或者多个IO条件准备读取,它就通知该进程。
$$$$$$$$$$$$$$$$$$$ IO多路复用适用如下场合:$$$$$$$$$$$$$$$$$
(1)当客户处理多个描述字时(一般是交互式输入和网络套接口),必须使用I/O复用。
(2)当一个客户同时处理多个套接口时,而这种情况是可能的,但很少出现。
(3)如果一个TCP服务器既要处理监听套接口,又要处理已连接套接口,一般也要用到I/O复用。
(4)如果一个服务器即要处理TCP,又要处理UDP,一般要使用I/O复用。
(5)如果一个服务器要处理多个服务或多个协议,一般要使用I/O复用。
select服务器与多进程/多线程服务器的比较
与多进程和多线程技术相比,I/O多路复用技术的最大优势是系统开销小,系统不必创建进程/线程,也不必维护这些进程/线程,从而大大减小了系统的开销。
下面重点对比select服务器和epoll服务器:
(一)select服务器原理图。
(二)epoll服务器模型
(三)优缺点对比
###################select的几大缺点:######################
(1)每次调用select,都需要把fd集合从用户态拷贝到内核态,这个开销在fd很多时会很大
(2)同时每次调用select都需要在内核遍历传递进来的所有fd,这个开销在fd很多时也很大
(3)select支持的文件描述符数量太小了,默认是1024点
###############epoll是select的改进其优势:#################
1、对于第一个缺点,epoll的解决方案在epoll_ctl函数中。每次注册新的事件到epoll句柄中时(在epoll_ctl中指定EPOLL_CTL_ADD),会把所有的fd拷贝进内核,而不是在epoll_wait的时候重复拷贝。epoll保证了每个fd在整个过程中只会拷贝一次。
2、对于第二个缺点,epoll的解决方案不像select或poll一样每次都把current轮流加入fd对应的设备等待队列中,而只在epoll_ctl时把current挂一遍(这一遍必不可少)并为每个fd指定一个回调函数,当设备就绪,唤醒等待队列上的等待者时,就会调用这个回调函数,而这个回调函数会把就绪的fd加入一个就绪链表)。epoll_wait的工作实际上就是在这个就绪链表中查看有没有就绪的fd(利用schedule_timeout()实现睡一会,判断一会的效果,和select实现中的第7步是类似的)。
3、对于第三个缺点,epoll没有这个限制,它所支持的FD上限是最大可以打开文件的数目,这个数字一般远大于2048,举个例子,在1GB内存的机器上大约是10万左右,具体数目可以cat /proc/sys/fs/file-max察看,一般来说这个数目和系统内存关系很大
三、select代码实现部分
//select_server.c
//本例是以读为例:
1 #include<stdio.h>
2 #include<sys/types.h>
3 #include<stdlib.h>
4 #include<string.h>
5 #include<sys/socket.h>
6 #include<netinet/in.h>
7 #include<arpa/inet.h>
8 #include<fcntl.h>
9 #include<unistd.h>
10 #include<sys/select.h>
11
12 int fds[1024];
13
14 static void usage(const char *proc)
15 {
16 printf("Usage: %s [local_ip][local_port]\n", proc);
17 }
18
19 int startup(const char* _ip , int _port)
20 {
21 int sock = socket(AF_INET , SOCK_STREAM , 0);
22 if(sock < 0)
23 {
24 perror("socket");
25 exit(2);
26 }
27 struct sockaddr_in local;
28 local.sin_family = AF_INET;
29 local.sin_port =htons(_port);
30 local.sin_addr.s_addr =inet_addr(_ip);
31
32 if(bind(sock , (struct sockaddr*)&local , sizeof(local)) < 0)
33 {
34 perror("bind");
35 exit(3);
36 }
37 if(listen(sock , 10) < 0)
38 {
39 perror("listen");
40 exit(4);
41 }
42 return sock;
43 }
44 int main(int argc , char *argv[])
45 {
46 if(argc != 3)
47 {
48 usage(argv[0]);
49 return 1;
50 }
51 int listen_sock = startup(argv[1] , atoi(argv[2]));
52 int nums = sizeof(fds) / sizeof(fds[0]);
53 int maxfd = -1;
54 int i = 1;
55 for( ; i < nums ; i++)
56 {
57 fds[i] = -1;
58 }
59 fds[0] = listen_sock;
60 while(1)
61 {
62 struct timeval timeout = {5 , 0};
63 fd_set rfds;//创建读文件描述符集
64 FD_ZERO( &rfds);
65 maxfd = -1;
66 for(i=0 ; i<nums ; i++ )
67 {
68 if(fds[i] > 0)
69 {
70 FD_SET(fds[i] , &rfds);
71 if(maxfd < fds[i])
72 {
73 maxfd = fds[i];
74 }
75 }
76 }
77 switch(select(maxfd+1 , &rfds , NULL , NULL ,&timeout))
78 {
79 case 0: printf("timeout....!\n"); break;
80 case -1: perror("select"); break;
81 default://at last one fd ready!
82 {
83 for(i=0 ; i<nums ;i++)
84 {
85 if(fds[i] < 0)
86 {
87 continue;
88 }
89 if (i==0 && FD_ISSET(listen_sock , &rfds))
90 {
91 //listen_sock ready
92 struct sockaddr_in client;
93 socklen_t len=sizeof(client);
94 int new_sock = accept(listen_sock,\
95 (struct sockaddr*)&client , &len );
96 if(new_sock < 0)
97 {
98 perror("accept");
99 continue;
100 }
101 printf("get new client: [%s:%d]",\
102 inet_ntoa(client.sin_addr),\
103 ntohs(client.sin_port));
104 int j = 1;
105 for( ; j<nums ; j++)
106 {
107 if(fds[j] == -1)
108 {
109 break;
110 }
111 }
112 if(j == nums)
113 {
114 printf("server full!\n");
115 close(new_sock);
116 }
117 else
118 {
119 fds[j] = new_sock;
120 }
121 }
122 else if(i > 0 && FD_ISSET(fds[i] , &rfds))
123 {
124 //other fd ready
125 char buf[1024];
126 ssize_t s = read(fds[i], buf ,sizeof(buf)-1);
127 if(s > 0)
128 {
129 buf[s] = 0;
130 printf("client say# %s\n",buf);
131 }
132 else if(s == 0)
133 {
134 printf("client quit!\n");
135 close(fds[i]);
136 fds[i] = -1;
137 }
138 else
139 {
140 perror("read");
141 }
142 }
143 else
144 {}
145 }
146 }
147 break;
148 }
149 }
150 return 0;
151 }