应用层
int poll(struct pollfd *fds, nfds_t nfds, int timeout);
注意:
1.nfds_t 为数组pollfd的个数,而内核则为数组fds的内存大小 即sizeof(fds[nfds])2.timeout 为毫秒底层驱动
unsigned int (*poll) (struct file *filp, struct poll_table_struct *wait){};
注意:
1. filp文件描述符,wait等待队列。此两个变量无需关心,由系统完成。
系统API(完整的调用过程)1.将应用层fds,nfds传入内核2.调用内核驱动对应的函数driver_poll(如io_poll)3.判断 fd.events ==fd.revents 是否相等(LDD3书上称为判断是否有可用的文件描述符),相等则退出,否则进入步骤44.判断是否超时,若无则进入sleep,等待唤醒5.唤醒后将fds,nfds返回应用层步骤3.4.5为 poll的精髓所在,明白了其中过程后,理解poll函数的驱动代码就相当简单了。例:
unsigned int io_poll (struct file *filp, struct poll_table_struct *wait) { unsigned int mask = 0; printk(KERN_INFO "IO poll entry\n"); poll_wait(filp, &dev->inq, wait); printk(KERN_INFO "IO poll exit\n"); mask |= POLLIN ; /* readable */ return mask; }
注意
1:poll_wait只是将filp dev->inq 加入到wait等待队列并未进行任何睡眠操作。真正的睡眠操作其实在步骤42.poll_table_struct *wait 为系统自动提供,无需注意。
# include < sys/ poll. h>
int poll ( struct pollfd * fds, unsigned int nfds, int timeout);
和select()不一样,poll()没有使用低效的三个基于位的文件描述符set,而是采用了一个单独的结构体pollfd数组,由fds指针指向这个组。pollfd结构体定义如下:
# include < sys/ poll. h>
struct pollfd {
int fd; /* 文件描述符 */
short events; /* 等待的事件 */
short revents; /* 实际发生了的事件 */
} ;
每一个pollfd结构体指定了一个被监视的文件描述符,可以传递多个结构体,指示poll()监视多个文件描述符。每个结构体的events域是监视该文件描述符的事件掩码,由用户来设置这个域。revents域是文件描述符的操作结果事件掩码。内核在调用返回时设置这个域。events域中请求的任何事件都可能在revents域中返回。合法的事件如下:
POLLIN
有数据可读。
POLLRDNORM
有普通数据可读。
POLLRDBAND
有优先数据可读。
POLLPRI
有紧迫数据可读。
POLLOUT
写数据不会导致阻塞。
POLLWRNORM
写普通数据不会导致阻塞。
POLLWRBAND
写优先数据不会导致阻塞。
POLLMSG
SIGPOLL 消息可用。
此外,revents域中还可能返回下列事件:
POLLER
指定的文件描述符发生错误。
POLLHUP
指定的文件描述符挂起事件。
POLLNVAL
指定的文件描述符非法。
这些事件在events域中无意义,因为它们在合适的时候总是会从revents中返回。使用poll()和select()不一样,你不需要显式地请求异常情况报告。
POLLIN | POLLPRI等价于select()的读事件,POLLOUT |POLLWRBAND等价于select()的写事件。POLLIN等价于POLLRDNORM |POLLRDBAND,而POLLOUT则等价于POLLWRNORM。
例如,要同时监视一个文件描述符是否可读和可写,我们可以设置 events为POLLIN |POLLOUT。在poll返回时,我们可以检查revents中的标志,对应于文件描述符请求的events结构体。如果POLLIN事件被设置,则文件描述符可以被读取而不阻塞。如果POLLOUT被设置,则文件描述符可以写入而不导致阻塞。这些标志并不是互斥的:它们可能被同时设置,表示这个文件描述符的读取和写入操作都会正常返回而不阻塞。
timeout参数指定等待的毫秒数,无论I/O是否准备好,poll都会返回。timeout指定为负数值表示无限超时,使poll()一直挂起直到一个指定事件发生;timeout为0指示poll调用立即返回并列出准备好I/O的文件描述符,但并不等待其它的事件。这种情况下,poll()就像它的名字那样,一旦选举出来,立即返回。
返回值和错误代码
成功时,poll()返回结构体中revents域不为0的文件描述符个数;如果在超时前没有任何事件发生,poll()返回0;失败时,poll()返回-1,并设置errno为下列值之一:
EBADF
一个或多个结构体中指定的文件描述符无效。
EFAULT
fds指针指向的地址超出进程的地址空间。
EINTR
请求的事件之前产生一个信号,调用可以重新发起。
EINVAL
nfds参数超出PLIMIT_NOFILE值。
ENOMEM
可用内存不足,无法完成请求。
#include <string.h>
#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <errno.h>
#include <poll.h>
/* int poll(struct pollfd *fds, nfds_t nfds, int timeout); */
/*
struct pollfd {
int fd; // file descriptor
short events; // requested events
short revents; // returned events
};
*/
/*
The bits that may be set/returned in events and revents are defined in
<poll.h>:
POLLIN: There is data to read.(数据可读)
POLLOUT:Writing now will not block.(数据可读)
*/
#define OPEN_FLAGS O_RDWR|O_CREAT
#define OPEN_MODE 00777
#define W_DATA "howaylee"
int main(int argc, char* argv[])
{
int ret = -1;
int fd1 = -1;
int fd2 = -1;
char r_buf[12] = {0};
struct pollfd fds[2] = {0};
//open fd1
fd1 = open(argv[1], OPEN_FLAGS, OPEN_MODE);
if (-1 == fd1)
{
perror("open fd1 failed: ");
return -1;
}
//write fd1
ret = write(fd1, W_DATA, sizeof(W_DATA));
if(-1 == ret)
{
perror("write fd1 failed: ");
goto _OUT;
}
//lseek fd1 head
ret = lseek(fd1, 0, SEEK_SET);
if(-1 == ret)
{
perror("lseek fd1 failed: ");
goto _OUT;
}
//open fd2
fd2 = open(argv[2], OPEN_FLAGS, OPEN_MODE);
if (-1 == fd2)
{
perror("open fd2 failed: ");
return -1;
}
/*阻塞,等待程序读写操作*/
while(1)
{
//初始化pollfd
fds[0].fd = fd1;
//可读
fds[0].events = POLLIN;
fds[1].fd = fd2;
//可写
fds[1].events = POLLOUT;
//poll
ret = poll(fds, sizeof(fds)/sizeof(fds[0]), -1);
if(-1 == ret)
{
perror("poll failed: ");
goto _OUT;
}
//read fd1
if(fds[0].revents & POLLIN )
{
//清空缓存
//memset(r_buf, 0, sizeof(r_buf));
ret = read(fd1, r_buf, sizeof(r_buf));
if(-1 == ret)
{
perror("poll read failed: ");
goto _OUT;
}
printf("read = %s\n", r_buf);
}
//write fd2
if(fds[1].revents & POLLOUT )
{
ret = write(fd2, r_buf, sizeof(r_buf));
if(-1 == ret)
{
perror("poll write failed: ");
goto _OUT;
}
printf("write = %s\n", r_buf);
}
}
//close fd1 fd2
close(fd1);
close(fd2);
_OUT:
return ret;
}
select 和驱动poll之间的关系
因为函数的传参和名字都差不多,我猜想内核是调用该函数的。
从上面的代码和《设备驱动程序》我得出来一下的结论:
1.应用层调用函数select,内核为了管理等待队列(有时候不止一个等待队列,因为select函数可以检测多个文件的状态),建立了一个poll_table_struct结构体(一个select系统调用对应一个结构体)。
2.poll_wait函数的调用,将三个参数传给了内核。内核中,通过结构体poll_table_struct找到另一个结构体poll_table_page,上面的代码可以看出来,这个结构体是一个维护多个poll_table_entry结构体的内存页链表,poll_wait函数的参数就是传到poll_table_entry结构体中。
3.再看一下poll_table_entry里面的成员,第一个成员srutct file是poll_wait的第一个参数,第二个成员就是定义了一个wait_queue_t的结构体,而这个结构体是正要添加到等待队列头中,也就是从poll_wait传来的第二个参数。
4.现在重头戏了,poll_wait的调用实际上调用了__pollwiat。看一下大概的操作:
4.1使用container_of函数,通过poll_table(即poll_table_struct)找到poll_wqueues,一看名字就猜到,它是存放等待队列的!poll_wqueues包含成员poll_table_page。
4.2通过传入的filp和等待队列头两个参数,新建一个poll_table_enter并添加到poll_table_page中。
2.2)对应设备的状态,返回相应的掩码。那就是说,如果设备可读,那就返回可读的掩码。
什么是掩码?有什么掩码?
掩码 | 含义 |
POLLIN | 设备可读。 |
POLLRDNORM | 数据可读。一般的,驱动可读,返回(POLLIN|POLLRDNORM),当然,只返回POLLIN也行,因为意思其实都可不多 |
POLLOUT | 设备可写 |
POLLWRNORM | 数据可写。一般的,驱动可写,返回(POLLOUT|POLLWRNORM),当然,只返回POLLOUT也行,因为意思其实都可不多 |
当然,还有其他的掩码,我这里就不意义介绍。
3)唤醒等待队列
其实一开始我也很奇怪为什么需要唤醒,毕竟poll_wait函数并不会导致休眠。为什么要唤醒?在哪里唤醒?
我上面的驱动函数,test_poll返回掩码,如果掩码为0,则表示设备不可读,这时,内核接到返回的掩码,知道设备不可读,此时select函数就会阻塞,进程休眠,等待有数据时被唤醒。所以,在写入数据后,需要唤醒等待队列头read_queue。此时设备可读了,就会再次调用test_poll函数,返回掩码POLLIN,select调用成功。
所以,这里得出两个结论:
1.test_poll并不会导致休眠,进程阻塞是系统调用select搞的鬼。
2.系统调用select的阻塞会导致test_poll被调用多次。
参考:http://blog.chinaunix.net/uid-15710823-id-2767553.html
http://hi.baidu.com/xzf20082004/item/622fb01a1018c7f5746a846f