在Linux中,我们可以使用select函数实现 I/O 端口的复用,传递给 select函数的参数会告诉内核:
- 我们所关心的文件描述符
- 对每个描述符,我们所关心的状态。(我们是要想从一个文件描述符中读或者写,还是关注一个描述符中是否出现异常)
- 我们要等待多长时间。(我们可以等待无限长的时间,等待固定的一段时间,或者根本就不等待)
从 select函数返回后,内核告诉我们一下信息:
- 对我们的要求已经做好准备的描述符的个数
- 对于三种条件哪些描述符已经做好准备.(读,写,异常)
有了这些返回信息,我们可以调用合适的I/O函数(通常是 read 或 write),并且这些函数不会再阻塞.
#include <sys/select.h>
int select(int maxfdp1, fd_set *readset, fd_set *writeset, fd_set *exceptset,struct timeval *timeout);
返回:做好准备的文件描述符的个数,超时为0,错误为 -1.
首先我们先看一下最后一个参数。它指明我们要等待的时间:
struct timeval
{
long tv_sec; /*秒 */
long tv_usec; /*微秒 */
}
有三种情况:
1 timeout == NULL 等待无限长的时间。等待可以被一个信号中断。当有一个描述符做好准备或者是捕获到一个信号时函数会返回。如果捕获到一个信号, select函数将返回 -1,并将变量 erro设为 EINTR。
2 timeout->tv_sec == 0 &&timeout->tv_usec == 0 不等待,直接返回。加入描述符集的描述符都会被测试,并且返回满足要求的描述符的个数。这种方法通过轮询,无阻塞地获得了多个文件描述符状态。
3 timeout->tv_sec !=0 ||timeout->tv_usec!= 0 等待指定的时间。当有描述符符合条件或者超过超时时间的话,函数返回。在超时时间即将用完但又没有描述符合条件的话,返回 0。对于第一种情况,等待也会被信号所中断。
中间的三个参数 readset, writset, exceptset,指向描述符集。这些参数指明了我们关心哪些描述符,和需要满足什么条件(可写,可读,异常)。一个文件描述集保存在 fd_set 类型中。fd_set类型变量每一位代表了一个描述符。我们也可以认为它只是一个由很多二进制位构成的数组。如下图所示:
对于 fd_set类型的变量我们所能做的就是声明一个变量,为变量赋一个同种类型变量的值,或者使用以下几个宏来控制它:
#include <sys/select.h>
int FD_ZERO(int fd, fd_set *fdset);
int FD_CLR(int fd, fd_set *fdset);
int FD_SET(int fd, fd_set *fd_set);
int FD_ISSET(int fd, fd_set *fdset);
FD_ZERO 宏将一个 fd_set类型变量的所有位都设为 0,使用 FD_SET 将变量的某个位置位。清除某个位时可以使用 FD_CLR,我们可以使用 FD_SET来测试某个位是否被置位。
当声明了一个文件描述符集后,必须用 FD_ZERO 将所有位置零。之后将我们所感兴趣的描述符所对应的位置位,操作如下:
fd_set rset;
int fd;
FD_ZERO(&rset);
FD_SET(fd, &rset);
FD_SET(stdin, &rset);
select返回后,用FD_ISSET测试给定位是否置位:
if(FD_ISSET(fd, &rset)
{
}
具体解释select的参数:
(1)int maxfdp 是一个整数值,是指集合中所有文件描述符的范围,即所有文件描述符的最大值加1,不能错。
说明:对于这个原理的解释可以看上边 fd_set 的详细解释,fd_set 是以位图的形式来存储这些文件描述符。maxfdp 也就是定义了位图中有效的位的个数。
(2)fd_set*readfds 是指向 fd_set 结构的指针,这个集合中应该包括文件描述符,我们是要监视这些文件描述符的读变化的,即我们关心是否可以从这些文件中读取数据了,如果这个集合中有一个文件可读,select 就会返回一个大于 0 的值,表示有文件可读;如果没有可读的文件,则根据 timeout 参数再判断是否超时,若超出 timeout 的时间,select 返回 0,若发生错误返回负值。可以传入 NULL 值,表示不关心任何文件的读变化。
(3)fd_set*writefds 是指向 fd_set 结构的指针,这个集合中应该包括文件描述符,我们是要监视这些文件描述符的写变化的,即我们关心是否可以向这些文件中写入数据了,如果这个集合中有一个文件可写,select 就会返回一个大于0的值,表示有文件可写,如果没有可写的文件,则根据timeout参数再判断是否超时,若超出 timeout 的时间,select 返回 0,若发生错误返回负值。可以传入 NULL 值,表示不关心任何文件的写变化。
(4)fd_set*errorfds 同上面两个参数的意图,用来监视文件错误异常文件。
(5)struct timeval* timeout 是 select 的超时时间,这个参数至关重要,它可以使 select处于三种状态,第一,若将NULL以形参传入,即不传入时间结构,就是将 select 置于阻塞状态,一定等到监视文件描述符集合中某个文件描述符发生变化为止;第二,若将时间值设为 0 秒 0 毫秒,就变成一个纯粹的非阻塞函数,不管文件描述符是否有变化,都立刻返回继续执行,文件无变化返回 0,有变化返回一个正值;第三,timeout 的值大于 0,这就是等待的超时时间,即 select 在 timeout 时间内阻塞,超时时间之内有事件到来就返回了,否则在超时后不管怎样一定返回,返回值同上述。
说明:
函数返回:
(1)当监视的相应的文件描述符集中满足条件时,比如说读文件描述符集中有数据到来时,内核(I/O)根据状态修改文件描述符集,并返回一个大于 0 的数。
(2)当没有满足条件的文件描述符,且设置的 timeval 监控时间超时时,select 函数会返回一个为 0 的值。
(3)当select返回负值时,发生错误。
理解select模型:
理解 select 模型的关键在于理解 fd_set,为说明方便,取 fd_set 长度为 1 字节,fd_set 中的每一 bit 可以对应一个文件描述符 fd。则 1 字节长的 fd_set 最大可以对应 8 个 fd。
(1)执行 fd_set set; FD_ZERO(&set);则 set 用位表示是 0000,0000。
(2)若 fd=5,执行 FD_SET(fd, &set);后 set 变为 0001,0000(第 5 位置为 1)
(3)若再加入 fd=2,fd = 1,则 set 变为 0001,0011
(4)执行select(6, &set, 0, 0, 0)阻塞等待
(5)若 fd = 1, fd = 2 上都发生可读事件,则 select 返回,此时 set 变为 0000,0011。注意:没有事件发生的 fd = 5 被清空。
基于上面的讨论,可以轻松得出 select 模型的特点:
(1)可监控的文件描述符个数取决与 sizeof(fd_set)的值。我这边服务器上 sizeof(fd_set)=512,每 bit 表示一个文件描述符,则我服务器上支持的最大文件描述符是512 * 8 = 4096。据说可调,另有说虽然可调,但调整上限受于编译内核时的变量值。
(2)将 fd 加入 select 监控集的同时,还要再使用一个数据结构 array 保存放到 select 监控集中的 fd,一是用于再 select 返回后,array 作为源数据和 fd_set 进行 FD_ISSET 判断。二是 select 返回后会把以前加入的但并无事件发生的 fd 清空,则每次开始 select 前都要重新从 array 取得 fd 逐一加入(FD_ZERO最先),扫描 array 的同时取得 fd 最大值 maxfd,用于 select 的第一个参数。
(3)可见 select 模型必须在 select 前循环 array(加 fd,取 maxfd),select 返回后循环 array(FD_ISSET判断是否有时间发生)。
基本原理
select() 系统调用代码走读
调用顺序如下:sys_select() -> core_sys_select() -> do_select() -> fop->poll()