Linux 下 select 函数剖析

在Linux中,我们可以使用 select 函数实现I/O端口的复用,传递给 select 函数的参数会告诉内核:
      • 我们所关心的文件描述符
      • 对每个描述符,我们所关心的状态。(我们是要想从一个文件描述符中读或者写,还是关注一个描述符中是否出现异常)
      • 我们要等待多长时间。(我们可以等待无限长的时间,等待固定的一段时间,或者根本就不等待)
    从 select 函数返回后,内核告诉我们一下信息:
      • 对我们的要求已经做好准备的描述符的个数
      • 对于三种条件哪些描述符已经做好准备.(读,写,异常)
    有了这些返回信息,我们可以调用合适的I/O函数(通常是 read 或 write),并且这些函数不会再阻塞.
#include <sys/select.h>   

    int select(int maxfdp1, fd_set *readset, fd_set *writeset, fd_set *exceptset, struct timeval *timeout)
  返回:做好准备的文件描述符的个数,超时为0,错误为 -1.
        首先我们先看一下最后一个参数。它指明我们要等待的时间:
struct timeval
{      
        long tv_sec;   /* 秒 */
        long tv_usec;  /* 微秒 */   
}
    有三种情况:
    timeout == NULL   等待无限长的时间。等待可以被一个信号中断。当有一个描述符做好准备或者是捕获到一个信号时函数会返回。如果捕获到一个信号, select 函数将返回 -1,并将变量 erro 设为 EINTR。
    timeout->tv_sec == 0 && timeout->tv_usec == 0 不等待,直接返回。加入描述符集的描述符都会被测试,并且返回满足要求的描述符的个数。这种方法通过轮询,无阻塞地获得了多个文件描述符状态。
    timeout->tv_sec !=0 ||timeout->tv_usec != 0  等待指定的时间。当有描述符符合条件或者超过超时时间的话,函数返回。在超时时间即将用完但又没有描述符合条件的话,返回 0。对于第一种情况,等待也会被信号所中断。
        中间的三个参数 readset, writset, exceptset, 指向描述符集。这些参数指明了我们关心哪些描述符,和需要满足什么条件(可写,可读,异常)。一个文件描述集保存在 fd_set 类型中。fd_set 类型变量每一位代表了一个描述符。我们也可以认为它只是一个由很多二进制位构成的数组。如下图所示:

     对于 fd_set 类型的变量我们所能做的就是声明一个变量,为变量赋一个同种类型变量的值,或者使用以下几个宏来控制它:
#include <sys/select.h>   

int FD_ZERO(int fd, fd_set *fdset);   

int FD_CLR(int fd, fd_set *fdset);   

int FD_SET(int fd, fd_set *fd_set);   

int FD_ISSET(int fd, fd_set *fdset);

 FD_ISSET这个理解要注意:

socket   s;   
.....   
fd_set   set;   
while(1)   
{       
      FD_ZERO(&set);//将你的套节字集合清空   
      FD_SET(s,   &set);//加入你感兴趣的套节字到集合,这里是一个读数据的套节字s   
      select(0,&set,NULL,NULL,NULL);//检查套节字是否可读,   
                                                        //很多情况下就是是否有数据(注意,只是说很多情况)  
                                                        //这里select是否出错没有写   
      if(FD_ISSET(s,   &set)   //检查s是否在这个集合里面,   
      {                                           //select将更新这个集合,把其中不可读的套节字去掉   
                                                  //只保留符合条件的套节字在这个集合里面                         
              recv(s,...);   
      }   
      //do   something   here   
}


FD_ISSET是检查s是否在这个集合里面,而不是代表s这个fd 的读写异常状态发生,因为我在select之前调用
FD_ISSET ,该函数的返回值还是 1,仅仅代表s是否在集合中,select之后由于会自动更更新这个集合,该集合
只保留了可读的套接字,这时候再调用 FD_ISSET 就相当于是在 一群可读写的套接字中选中某一个套接字查询他
是在该集合内
    FD_ZERO宏将一个 fd_set 类型变量的所有位都设为 0,使用FD_SET 将变量的某个位置位。清除某个位时可以使用 FD_CLR,我们可以
使用 FD_SET 来测试某个位是否被置位。 当声明了一个文件描述符集后,必须用FD_ZERO将所有位置零。之后将我们所感兴趣的描述符所对
应的位置位,操作如下:
fd_set rset;   
int fd;   
FD_ZERO(&rset);   
FD_SET(fd, &rset);   
FD_SET(stdin, &rset);

 

    select 返回后,用FD_ISSET测试给定位是否置位:
if(FD_ISSET(fd, &rset)   
{ ... }

描述符就绪条件

  1. 满足下列四个条件中的任何一个时,一个套接字准备好读:

  1)该套接字接收缓冲区中的数据字节数大于等于套接字接收缓存区低水位标记的当前大小。对于TCP和UDP套接字而言,缓冲区低水位的值默认为1。那就意味着,默认情况下,只要缓冲区中有数据,那就是可读的。我们可以通过使用SO_RCVLOWAT套接字选项(参见setsockopt函数)来设置该套接字的低水位大小。此种描述符就绪(可读)的情况下,当我们使用read/recv等对该套接字执行读操作的时候,套接字不会阻塞,而是成功返回一个大于0的值(即可读数据的大小)。

  2)该连接的读半部关闭(也就是接收了FIN的TCP连接)。对这样的套接字的读操作,将不会阻塞,而是返回0(也就是EOF)。

  3)该套接字是一个listen的监听套接字,并且目前已经完成的连接数不为0。对这样的套接字进行accept操作通常不会阻塞。

  4)有一个错误套接字待处理。对这样的套接字的读操作将不阻塞并返回-1(也就是返回了一个错误),同时把errno设置成确切的错误条件。这些待处理错误(pending error)也可以通过指定SO_ERROR套接字选项调用getsockopt获取并清除。

 

  2. 满足下列四个条件中的任何一个时,一个套接字准备好写:

  1)该套接字发送缓冲区中的可用空间字节数大于等于套接字发送缓存区低水位标记时,并且该套接字已经成功连接(UDP套接字不需要连接)。对于TCP和UDP而言,这个低水位的值默认为2048,而套接字默认的发送缓冲区大小是8K,这就意味着一般一个套接字连接成功后,就是处于可写状态的。我们可以通过SO_SNDLOWAT套接字选项(参见setsockopt函数)来设置这个低水位。此种情况下,我们设置该套接字为非阻塞,对该套接字进行写操作(如write、send等),将不阻塞,并返回一个正值(例如由传输层接受的字节数,即发送的数据大小)。

  2)该连接的写半部关闭。对这样的套接字的写操作将会产生SIGPIPE信号。所以我们的网络程序基本都要自定义处理SIGPIPE信号。因为SIGPIPE信号的默认处理方式是程序退出。

  3)使用非阻塞的connect套接字已建立连接,或者connect已经以失败告终。

  4)有一个错误的套接字待处理。对这样的套接字的写操作将不阻塞并返回-1(也就是返回了一个错误),同时把errno设置成确切的错误条件。这些待处理的错误也可以通过指定SO_ERROR套接字选项调用getsockopt获取并清除。

  

  3. 如果一个套接字存在带外数据(out-of-band data)或者仍处于带外标记,那么它有异常条件待处理。 

  带外数据有时也称为经加速数据(expedited data)。其想法是一个连接的某端发生了重要的事情,而且该端希望迅速通告其对端。这里的“迅速”意味着这种通知应该在已经排队等待发送的任何“普通”(有时称为带内)数据之前发送。也就是说,带外数据被认为具有比普通数据更高的优先级。带外数据并不要求在客户和服务器之间再使用一个连接,而是被映射到已有的连接中。

  UDP套接字不存在带外数据。TCP并没有真正的带外数据,不过提供了紧急模式(urgent mode)(TCP数据包头部的紧急指针)。

  注意:当某个套接字上发生错误时,它将由select标记为既可写又可读。

  关于带外数据更详细的请参考《UNIX网络编程 卷1》第24章。

 

  接收低水位标记和发送低水位标记的目的在于:允许应用进程控制在select返回可读或可写条件之前有多少数据可读或有多大空间可用于写。举例来说,如果我们知道除非至少存在64个字节的数据,否则我们的应用进程没有任何有效工作可做,那么可以把接收低水位标记设置为64,以防少于64个字节的数据准备好读时select唤醒我们。

  任何UDP套接字只要发送低水位标记小于等于发送缓冲区大小(默认应该总是这种关系)就总是可写的,这是因为UDP套接字不需要连接。

  

  下图汇总了导致select返回某个套接字就绪的条件

  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值