Select函数实现原理分析

本文转自

http://blog.csdn.net/codejoker/article/details/5404442?locationNum=1


select 需要驱动程序的支持,驱动程序实现fops内的poll 函数 select 通过每个设备文件对应的 poll 函数提供的信息判断当前是否有资源可用 ( 如可读或写 ) ,如果有的话则返回可用资源的文件描述符个数,没有的话则睡眠,等待有资源变为可用时再被唤醒继续执行。

下面我们分两个过程来分析 select 

1. select的睡眠过程

支持阻塞操作的设备驱动通常会实现一组自身的等待队列如读/写等待队列用于支持上层(用户层)所需的BLOCK或NONBLOCK操作。当应用程序通过设备驱 动访问该设备时(默 认为BLOCK操 作),若该设备当 前没有数据可读或写,则将该用户进程插入到该设备驱动对应的读/写等待队列让其睡眠一段时间,等到有数据可读/写时再将该进程唤醒。

select就是巧妙的利用等待队列机制让用户进程适当在没有资源可读/写时睡眠,有资源可读/写时唤醒。下面我们看看select睡眠的详细过程。select 会循环遍历它所监测的fd_set内的所有文件描述符对应的驱动程序的poll函数。驱动程序提供的poll函数首先会将调用select的用户进程插入到该设备驱动对应资源的等待队列(如读/写等待队列) ,然后返回一个bitmask告诉select当前资源哪些可用。当select循环遍历完s所有fd_set内指定的文件描述符对应的 poll 函数后,如果没有一个资源可用(即没有一个文件可供操作) ,则select让该进程睡眠,一直等到有资源可用为止,进程被唤醒(或者timeout)继续往下执行。

下面分析一下代码是如何实现的。

select的调用path如下: sys_select -> core_sys_select -> do_select

其中最重要的函数是do_select,最主要的工作是在这里,前面两个函数主要做一些准备工作。do_select 定义如下:

int do_select(int n, fd_set_bits *fds, s64 *timeout)  
{  
    struct poll_wqueues table;  
    poll_table *wait;  
    int retval, i;  
    rcu_read_lock();  
    retval = max_select_fd(n, fds);  
    rcu_read_unlock();  
    if (retval < 0)  
        return retval;  
    n = retval;  
    poll_initwait(&table);  
    wait = &table.pt;  
    if (!*timeout)  
        wait = NULL;  
    retval = 0;        //retval用于保存已经准备好的描述符数,初始为0  
    for (;;) {  
        unsigned long *rinp, *routp, *rexp, *inp, *outp, *exp;  
        long __timeout;  
        set_current_state(TASK_INTERRUPTIBLE);    //将当前进程状态改为TASK_INTERRUPTIBLE  
        inp = fds->in; outp = fds->out; exp = fds->ex;  
        rinp = fds->res_in; routp = fds->res_out; rexp = fds->res_ex;  
        for (i = 0; i < n; ++rinp, ++routp, ++rexp) { //遍历每个描述符  
            unsigned long in, out, ex, all_bits, bit = 1, mask, j;  
            unsigned long res_in = 0, res_out = 0, res_ex = 0;  
            const struct file_operations *f_op = NULL;  
            struct file *file = NULL;  
            in = *inp++; out = *outp++; ex = *exp++;  
            all_bits = in | out | ex;  
            if (all_bits == 0) {  
                i += __NFDBITS;       // //如果这个字没有待查找的描述符, 跳过这个长字(32位)  
                continue;  
            }  
            for (j = 0; j < __NFDBITS; ++j, ++i, bit <<= 1) {     //遍历每个长字里的每个位  
                int fput_needed;  
                if (i >= n)  
                    break;  
                if (!(bit & all_bits))  
                    continue;  
                file = fget_light(i, &fput_needed);  
                if (file) {  
                    f_op = file->f_op;  
                    MARK(fs_select, "%d %lld",  
                        i, (long long)*timeout);  
                    mask = DEFAULT_POLLMASK;  
                    if (f_op && f_op->poll)  
                        /* 在这里循环调用所监测的fd_set内的所有文件描述符对应的驱动程序的poll函数 */  
                        mask = (*f_op->poll)(file, retval ? NULL : wait);  
                    fput_light(file, fput_needed);  
                    if ((mask & POLLIN_SET) && (in & bit)) {  
                        res_in |= bit; //如果是这个描述符可读, 将这个位置位  
                        retval++;  //返回描述符个数加1  
                    }  
                    if ((mask & POLLOUT_SET) && (out & bit)) {  
                        res_out |= bit;  
                        retval++;  
                    }  
                    if ((mask & POLLEX_SET) && (ex & bit)) {  
                        res_ex |= bit;  
                        retval++;  
                    }  
                }  
                cond_resched();  
            }  
            //返回结果  
            if (res_in)  
                *rinp = res_in;  
            if (res_out)  
                *routp = res_out;  
            if (res_ex)  
                *rexp = res_ex;  
        }  
        wait = NULL;  
        /* 到这里遍历结束。retval保存了检测到的可操作的文件描述符的个数。如果有文件可操作,则跳出for(;;)循环,直接返回。若没有文件可操作且timeout时间未到同时没有收到signal,则执行schedule_timeout睡眠。睡眠时间长短由__timeout决定,一直等到该进程被唤醒。 
        那该进程是如何被唤醒的?被谁唤醒的呢? 
        我们看下面的select唤醒过程*/  
        if (retval || !*timeout || signal_pending(current))  
            break;  
        if(table.error) {  
            retval = table.error;  
            break;  
        }  
        if (*timeout < 0) {  
            /* Wait indefinitely */  
            __timeout = MAX_SCHEDULE_TIMEOUT;  
        } else if (unlikely(*timeout >= (s64)MAX_SCHEDULE_TIMEOUT - 1)) {  
            /* Wait for longer than MAX_SCHEDULE_TIMEOUT. Do it in a loop */  
            __timeout = MAX_SCHEDULE_TIMEOUT - 1;  
            *timeout -= __timeout;  
        } else {  
            __timeout = *timeout;  
            *timeout = 0;  
        }  
        __timeout = schedule_timeout(__timeout);  
        if (*timeout >= 0)  
            *timeout += __timeout;  
    }  
    __set_current_state(TASK_RUNNING);  
    poll_freewait(&table);  
    return retval;  
}  

2.  select 的唤醒过程

前面介绍了 select 会循环遍历它所监测的 fd_set 内的所有文件描述符对应的驱动 程序的 poll 函 数。驱动程序提供的 poll 函数首先会将调用 select 的用户进程插入到该设备驱动对应资源的等待队列 ( 如读 / 写等待队列 ) ,然后返回一个 bitmask 告诉 select 当前资源哪些可用。

一个典型的驱动程序 poll 函数实现如下:

( 摘 自《 Linux Device Drivers – ThirdEdition 》 Page 165)

static unsigned int scull_p_poll(struct file *filp, poll_table *wait)  
{  
    struct scull_pipe *dev = filp->private_data;  
    unsigned int mask = 0;  
    /* 
    * The buffer is circular; it is considered full 
    * if "wp" is right behind "rp" and empty if the 
    * two are equal. 
    */  
    down(&dev->sem);  
    poll_wait(filp, &dev->inq,  wait);  
    poll_wait(filp, &dev->outq, wait);  
    if (dev->rp != dev->wp)  
        mask |= POLLIN | POLLRDNORM;    /* readable */  
    if (spacefree(dev))  
        mask |= POLLOUT | POLLWRNORM;   /* writable */  
    up(&dev->sem);  
    return mask;  
}  

将用户进程插入驱动的等待队列是通过poll_wait做的。Poll_wait定义如下:

static inline void poll_wait(struct file * filp, wait_queue_head_t * wait_address, poll_table *p)  
{  
    if (p && wait_address)  
        p->qproc(filp, wait_address, p);  
}  
这里的p->qproc在do_select内poll_initwait(&table)被初始化为__pollwait,如下:

void poll_initwait(struct poll_wqueues *pwq)  
{  
    init_poll_funcptr(&pwq->pt, __pollwait);  
    pwq->error = 0;  
    pwq->table = NULL;  
    pwq->inline_index = 0;  
}  
__pollwait定义如下:

/* Add a new entry */  
static void __pollwait(struct file *filp, wait_queue_head_t *wait_address,  
                       poll_table *p)  
{  
    struct poll_table_entry *entry = poll_get_entry(p);  
    if (!entry)  
        return;  
    get_file(filp);  
    entry->filp = filp;  
    entry->wait_address = wait_address;  
    init_waitqueue_entry(&entry->wait, current);  
    add_wait_queue(wait_address,&entry->wait);  
} 
通过   init_waitqueue_entry   初始化一个等待队列项,这个等待队列项关联的进程即当前调用   select   的进程。然后将这个等待队列项插 入等待队列   wait_address     Wait_address   即在驱动   poll   函数内调用   poll_wait(filp, &dev->inq, wait);   时传入的该驱动的   &dev->inq   或者   &dev->outq   等待队列。

到这里我们明白了 select 如何当前进程插入所有所监测的fd_set关联的驱动内的等待队列,那进 程究竟是何时让出 CPU 进入睡眠状态的呢?

进入睡眠状态是在do_select内调用schedule_timeout(__timeout) 实现的。当select遍历完fd_set内的所有设备文件,发现没有文件可操作时(即retval=0), 则调用schedule_timeout(__timeout)进入睡眠状态。

唤醒该进程的过程通常是在所监测文件的设备驱动内实现的, 驱动程序维护了针对自身资源读写的等待队列。当设备驱动发现自身资源变为可读写并且有进程睡眠在该资源的等待队列上时,就会唤醒这个资源等待队列上的进 程。

到这里明白了   select   进程被唤醒的过程。由于该进程是阻塞在所有监测的文件对应的设备等待队列上的,因此在 timeout   时间内,只要任意个设备变为可操作,都会立即唤醒该进程,从而继续往下执行。这就实现了   select   的当有一个文件描述符可操作时 就立即唤醒执行的基本原理。


  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值