Linux设备驱动---poll函数

一个完整的poll函数其实包括3部分。应用层,系统API接口,底层驱动。读者可以读下 do_sys_poll(fs/select.c)源码,很简单,这里只总结重点。
应用层
int poll(struct pollfd *fds, nfds_t nfds, int timeout);
注意:
1.nfds_t 为数组pollfd的个数,而内核则为数组fds的内存大小 即sizeof(fds[nfds])
2.timeout 为毫秒
底层驱动
unsigned int (*poll) (struct file *filp, struct poll_table_struct *wait){};
注意:
1. filp文件描述符,wait等待队列。此两个变量无需关心,由系统完成。

系统API(完整的调用过程
1.将应用层fds,nfds传入内核
2.调用内核驱动对应的函数driver_poll(如io_poll)
3.判断 fd.events ==fd.revents 是否相等(LDD3书上称为判断是否有可用的文件描述符),相等则退出,否则进入步骤4
4.判断是否超时,若无则进入sleep,等待唤醒
5.唤醒后将fds,nfds返回应用层
步骤3.4.5为 poll的精髓所在,明白了其中过程后,理解poll函数的驱动代码就相当简单了。
例:
unsigned int io_poll (struct file *filp, struct poll_table_struct *wait)
{
	unsigned int mask = 0;
	printk(KERN_INFO "IO poll entry\n");
	poll_wait(filp, &dev->inq,  wait);
	printk(KERN_INFO "IO poll exit\n");
	mask |= POLLIN ;	/* readable */
	return mask;	
}
注意
1:poll_wait只是将filp dev->inq 加入到wait等待队列并未进行任何睡眠操作。真正的睡眠操作其实在步骤4
2.poll_table_struct *wait 为系统自动提供,无需注意。



# include < sys/ poll. h>
int poll ( struct pollfd * fds, unsigned int nfds, int timeout);
和select()不一样,poll()没有使用低效的三个基于位的文件描述符set,而是采用了一个单独的结构体pollfd数组,由fds指针指向这个组。pollfd结构体定义如下:

 

# include < sys/ poll. h>

struct pollfd {
int fd;         /* 文件描述符 */
short events;         /* 等待的事件 */
short revents;       /* 实际发生了的事件 */
} ; 


每一个pollfd结构体指定了一个被监视的文件描述符,可以传递多个结构体,指示poll()监视多个文件描述符。每个结构体的events域是监视该文件描述符的事件掩码,由用户来设置这个域。revents域是文件描述符的操作结果事件掩码。内核在调用返回时设置这个域。events域中请求的任何事件都可能在revents域中返回。合法的事件如下:
POLLIN
有数据可读。
POLLRDNORM
有普通数据可读。
POLLRDBAND
有优先数据可读。
POLLPRI
有紧迫数据可读。
POLLOUT
写数据不会导致阻塞。
POLLWRNORM
写普通数据不会导致阻塞。
POLLWRBAND
写优先数据不会导致阻塞。
POLLMSG
SIGPOLL 消息可用。

此外,revents域中还可能返回下列事件:
POLLER
指定的文件描述符发生错误。
POLLHUP
指定的文件描述符挂起事件。
POLLNVAL
指定的文件描述符非法。

这些事件在events域中无意义,因为它们在合适的时候总是会从revents中返回。使用poll()和select()不一样,你不需要显式地请求异常情况报告。
POLLIN | POLLPRI等价于select()的读事件,POLLOUT |POLLWRBAND等价于select()的写事件。POLLIN等价于POLLRDNORM |POLLRDBAND,而POLLOUT则等价于POLLWRNORM。
例如,要同时监视一个文件描述符是否可读和可写,我们可以设置 events为POLLIN |POLLOUT。在poll返回时,我们可以检查revents中的标志,对应于文件描述符请求的events结构体。如果POLLIN事件被设置,则文件描述符可以被读取而不阻塞。如果POLLOUT被设置,则文件描述符可以写入而不导致阻塞。这些标志并不是互斥的:它们可能被同时设置,表示这个文件描述符的读取和写入操作都会正常返回而不阻塞。
timeout参数指定等待的毫秒数,无论I/O是否准备好,poll都会返回。timeout指定为负数值表示无限超时,使poll()一直挂起直到一个指定事件发生;timeout为0指示poll调用立即返回并列出准备好I/O的文件描述符,但并不等待其它的事件。这种情况下,poll()就像它的名字那样,一旦选举出来,立即返回。


返回值和错误代码
成功时,poll()返回结构体中revents域不为0的文件描述符个数;如果在超时前没有任何事件发生,poll()返回0;失败时,poll()返回-1,并设置errno为下列值之一:
EBADF
一个或多个结构体中指定的文件描述符无效。
EFAULT
fds指针指向的地址超出进程的地址空间。
EINTR
请求的事件之前产生一个信号,调用可以重新发起。
EINVAL
nfds参数超出PLIMIT_NOFILE值。
ENOMEM
可用内存不足,无法完成请求。

#include <string.h>
#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <errno.h>
#include <poll.h>

/* int poll(struct pollfd *fds, nfds_t nfds, int timeout); */

/*
   struct pollfd {
   int   fd;         // file descriptor 
   short events;     // requested events 
   short revents;    // returned events
   };
 */
/*
   The  bits that may be set/returned in events and revents are defined in
   <poll.h>:
POLLIN: There is data to read.(数据可读)
POLLOUT:Writing now will not block.(数据可读)
 */

#define OPEN_FLAGS O_RDWR|O_CREAT
#define OPEN_MODE  00777

#define W_DATA "howaylee"

int main(int argc, char* argv[])
{
 int ret = -1;
 int fd1 = -1;
 int fd2 = -1;

 char r_buf[12] = {0};

 struct pollfd fds[2] = {0};

 //open fd1
 fd1 = open(argv[1], OPEN_FLAGS, OPEN_MODE);
 if (-1 == fd1)
 {
  perror("open fd1 failed: ");
  return -1;
 }
 //write fd1
 ret = write(fd1, W_DATA, sizeof(W_DATA));
 if(-1 == ret)
 {
  perror("write fd1 failed: ");
  goto _OUT;
 }
 //lseek fd1 head
 ret = lseek(fd1, 0, SEEK_SET);
 if(-1 == ret)
 {
  perror("lseek fd1 failed: ");
  goto _OUT;
 }

 //open fd2
 fd2 = open(argv[2], OPEN_FLAGS, OPEN_MODE);
 if (-1 == fd2)
 {
  perror("open fd2 failed: ");
  return -1;
 }

 /*阻塞,等待程序读写操作*/


 while(1)
 {
  //初始化pollfd
  fds[0].fd = fd1;
  //可读
  fds[0].events = POLLIN;

  fds[1].fd = fd2;
  //可写
  fds[1].events = POLLOUT;

  //poll
  ret = poll(fds, sizeof(fds)/sizeof(fds[0]), -1);
  if(-1 == ret)
  {
   perror("poll failed: ");
   goto _OUT;
  }

  //read fd1
  if(fds[0].revents & POLLIN )
  {
   //清空缓存
   //memset(r_buf, 0, sizeof(r_buf));
   ret = read(fd1, r_buf, sizeof(r_buf));
   if(-1 == ret)
   {
    perror("poll read failed: ");
    goto _OUT;
   }
   printf("read = %s\n", r_buf);
  }

  //write fd2
  if(fds[1].revents & POLLOUT )
  {
   ret = write(fd2, r_buf, sizeof(r_buf));
   if(-1 == ret)
   {
    perror("poll write failed: ");
    goto _OUT;
   }
   printf("write = %s\n", r_buf);
  }
 }

 //close fd1 fd2
 close(fd1);
 close(fd2);

_OUT:
 return ret;
}

 

 select 和驱动poll之间的关系

因为函数的传参和名字都差不多,我猜想内核是调用该函数的。

从上面的代码和《设备驱动程序》我得出来一下的结论:

1.应用层调用函数select,内核为了管理等待队列(有时候不止一个等待队列,因为select函数可以检测多个文件的状态),建立了一个poll_table_struct结构体(一个select系统调用对应一个结构体)。

2.poll_wait函数的调用,将三个参数传给了内核。内核中,通过结构体poll_table_struct找到另一个结构体poll_table_page,上面的代码可以看出来,这个结构体是一个维护多个poll_table_entry结构体的内存页链表,poll_wait函数的参数就是传到poll_table_entry结构体中。

3.再看一下poll_table_entry里面的成员,第一个成员srutct file是poll_wait的第一个参数,第二个成员就是定义了一个wait_queue_t的结构体,而这个结构体是正要添加到等待队列头中,也就是从poll_wait传来的第二个参数。

4.现在重头戏了,poll_wait的调用实际上调用了__pollwiat。看一下大概的操作:

4.1使用container_of函数,通过poll_table(即poll_table_struct)找到poll_wqueues,一看名字就猜到,它是存放等待队列的!poll_wqueues包含成员poll_table_page。

4.2通过传入的filp和等待队列头两个参数,新建一个poll_table_enter并添加到poll_table_page中。


2.2)对应设备的状态,返回相应的掩码。那就是说,如果设备可读,那就返回可读的掩码。

什么是掩码?有什么掩码?

掩码

含义

POLLIN

设备可读。

POLLRDNORM

数据可读。一般的,驱动可读,返回(POLLIN|POLLRDNORM),当然,只返回POLLIN也行,因为意思其实都可不多

POLLOUT

设备可写

POLLWRNORM

数据可写。一般的,驱动可写,返回(POLLOUT|POLLWRNORM),当然,只返回POLLOUT也行,因为意思其实都可不多

当然,还有其他的掩码,我这里就不意义介绍。


3)唤醒等待队列

其实一开始我也很奇怪为什么需要唤醒,毕竟poll_wait函数并不会导致休眠。为什么要唤醒?在哪里唤醒?

我上面的驱动函数,test_poll返回掩码,如果掩码为0,则表示设备不可读,这时,内核接到返回的掩码,知道设备不可读,此时select函数就会阻塞,进程休眠,等待有数据时被唤醒。所以,在写入数据后,需要唤醒等待队列头read_queue。此时设备可读了,就会再次调用test_poll函数,返回掩码POLLIN,select调用成功。

所以,这里得出两个结论:

1.test_poll并不会导致休眠,进程阻塞是系统调用select搞的鬼。

2.系统调用select的阻塞会导致test_poll被调用多次。



参考:http://blog.chinaunix.net/uid-15710823-id-2767553.html

          http://hi.baidu.com/xzf20082004/item/622fb01a1018c7f5746a846f

 

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值