STM32MP157学习——Linux阻塞和非阻塞IO(上)
0.前言
阻塞和非阻塞 IO 是 Linux 驱动开发里面很常见的两种设备访问模式,在编写驱动的时候一定要考虑到对设备文件使用阻塞还是非阻塞操作模式。本节主要就是讲述如果选择IO模式,以及如何在驱动程序使用等待队列和 poll 机制。
一、相关知识
1.阻塞和非阻塞介绍
IO 指的是 Input/Output,也就是输入/输出,是应用程序对设备驱动的输入/输出操作。当应用程序对设备驱动进行操作时,如果不能获取到设备资源,那么阻塞式 IO 就会将应用程序对应的线程挂起,直到设备资源可以获取为止。对于非阻塞 IO,应用程序对应的线程不会挂起,它要么一直轮询等待,直到设备资源可以使用,要么就直接放弃。
阻塞式IO:应用程序调用 read 函数从设备中读取数据,当设备不可用或数据未准备好的时候就会进入到休眠态。等设备可用的时候就会从休眠态唤醒,然后从设备中读取数据返回给应用程序。
非阻塞IO:应用程序使用非阻塞访问方式从设备读取数据,当设备不可用或数据未准备好时会立即向内核返回一个错误码,表示数据读取失败。应用程序会再次重新读取数据,这样一直循环,直到数据读取成功。
使用示例:
int fd;
int data = 0;
fd = open("/dev/xxx_dev", O_RDWR); /* 阻塞方式打开 */
fd = open("/dev/xxx_dev", O_RDWR | O_NONBLOCK); /* 非阻塞方式打开 */
ret = read(fd, &data, sizeof(data)); /*读取数据*/
2.等待队列
①等待队列头
阻塞访问最大的好处就是当设备文件不可操作时,进程可以进入休眠态,这样可以将CPU 资源让出来。但是,当设备文件可以操作的时候就必须唤醒进程,一般在中断函数中完成唤醒工作。
Linux 内核提供了等待队列(wait queue)来实现阻塞进程的唤醒工作,如果要在驱动中使用等待队列,必须创建并初始化一个等待队列头,等待队列头使用结构体 wait_queue_head 表示,wait_queue_head 结构体定义在文件include/linux/wait.h
中,结构体内容如下所示:
struct wait_queue_head {
spinlock_t lock;
struct list_head head;
};
typedef struct wait_queue_head wait_queue_head_t;
wait_queue_head_t 是 wait_queue_head 的别名,主要是为了兼容老版本。
定义好等待队列头后,使用 init_waitqueue_head 函数进行初始化。
void init_waitqueue_head(struct wait_queue_head *wq_head)
参数 wq_head 就是要初始化的等待队列头。也可以使用宏 DECLARE_WAIT_QUEUE_HEAD 来一次性完成等待队列头的定义和初始化。
②等待队列项
等待队列头就是一个等待队列的头部,每个访问设备的进程都是一个队列项,当设备不可用时就将这些进程对应的队列项添加到等待队列中。旧版本Linux内核使用结构体 wait_queue_t 表示等待队列项,在5.4版本以后,删除了这个结构体,使用 wait_queue_entry 代替,不过只是换了个名字,成员变量不变:
struct wait_queue_entry {
unsigned int flags;
void *private;
wait_queue_func_t func;
struct list_head entry;
};
使用宏 DECLARE_WAITQUEUE 定义并初始化一个等待队列项,宏内容如下:
DECLARE_WAITQUEUE(name, tsk)
name 是等待队列项的名字,tsk 表示这个等待队列项属于哪个任务(进程),一般设置为current
,在 Linux 内核中 current 相当于一个全局变量,表示当前进程。因此宏 DECLARE_WAITQUEUE 就是给当前正在运行的进程创建并初始化了一个等待队列项。
③将队列项添加/移除到等待队列头
当设备不可访问时,需要将进程对应的等待队列项添加到前面创建的等待队列头中,只有添加到等待队列头中以后进程才能进入休眠态。当设备可以访问以后再将进程对应的等待队列项从等待队列头中移除。所使用的API函数如下:
添加等待队列项:
void add_wait_queue(struct wait_queue_head *wq_head,
struct wait_queue_entry *wq_entry)
参数:
wq_head:等待队列项要加入的等待队列头
wq_entry:要加入的等待队列项
返回值:无
移除等待队列项:
void remove_wait_queue(struct wait_queue_head *wq_head,
struct wait_queue_entry *wq_entry)
参数:
wq_head:要删除的等待队列项所处的等待队列头
wq_entry:要删除的等待队列项
返回值:无
④等待唤醒
当设备可以使用的时候就要唤醒进入休眠态的进程,唤醒可以使用如下两个函数:
void wake_up(struct wait_queue_head *wq_head)
void wake_up_interruptible(struct wait_queue_head *wq_head)
参数 wq_head 就是要唤醒的等待队列头,这两个函数会将这个等待队列头中的所有进程都唤醒。wake_up 函数可以唤醒处于 TASK_INTERRUPTIBLE 和 TASK_UNINTERRUPTIBLE 状态的进程,而 wake_up_interruptible 函数只能唤醒处于 TASK_INTERRUPTIBLE 状态的进程。
⑤等待事件
除了主动唤醒以外,也可以设置等待队列等待某个事件,当这个事件满足以后就自动唤醒等待队列中的进程。相关API如下:
函数 | 描述 |
---|---|
wait_event(wq_head, condition) | 等待以 wq_head 为等待队列头的等待队列被唤醒,前提是 condition 条件必须满足(为真),否则一直阻塞。此函数会将进程设置为TASK_UNINTERRUPTIBLE 状态 |
wait_event_timeout(wq_head, condition, timeout) | 功能和 wait_event 类似,但是此函数可以添加超时时间,以 jiffies 为单位。此函数有返回值,如果返回 0 表示超时时间到,而且 condition 为假。为 1 表示 condition 为真,也就是条件满足了。 |
wait_event_interruptible(wq_head, condition) | 与 wait_event 函数类似,但是此函数将进程设置为 TASK_INTERRUPTIBLE,也就是可以被信号打断。 |
wait_event_interruptible_timeout(wq_head, condition, timeout) | 与 wait_event_timeout 函数类似,此函数也将进程设置为TASK_INTERRUPTIBLE,可以被信号打断。 |
3.轮询
如果应用程序以非阻塞的方式访问设备,设备驱动程序就要提供非阻塞的处理方式,也就是轮询。poll、epoll 和 select 可以用于处理轮询,应用程序通过 select、epoll 或 poll 函数来查询设备是否可以操作,如果可以操作的话就从设备读取或者向设备写入数据。当应用程序调用 select、epoll 或 poll 函数时,设备驱动程序中的 poll 函数就会执行,因此需要在设备驱动程序中编写 poll 函数。
首先介绍 select、epoll 和 poll 函数:
①select 函数
原型:
int select(int nfds,
fd_set *readfds,
fd_set *writefds,
fd_set *exceptfds,
struct timeval *timeout)
参数:
nfds:所要监视的这三类文件描述集合中,最大的文件描述符加 1
readfds、writefds 和 exceptfds:这三个指针指向描述符集合,这三个参数指明了关心哪些描述符、需要满足哪些条件等。三个参数都是 fd_set 类型,fd_set 类型变量的每一个位都代表了一个文件描述符。readfds 用于监视指定描述符集的读变化,也就是监视这些文件是否可以读取,只要这些集合里面有一个文件可以读取那么 seclect 就会返回一个大于 0 的值。如果没有文件可以读取,那么就会根据 timeout 参数来判断是否超时。可以将 readfs 设置为 NULL,表示不关心任何文件的读变化。writefds 和 readfs 类似,只是 writefs 用于监视这些文件是否可以进行写操作。exceptfds 用于监视这些文件的异常。
timeout:超时时间,当调用 select 函数等待某些文件描述符可以设置超时时间,超时时间使用结构体 timeval 表示,设置为NULL表示无限期等待。
struct timeval {
long tv_sec; /* 秒 */
long tv_usec; /* 微妙 */
};
返回值:
0:表示超时发生,但是没有任何文件描述符可以进行操作
-1:发生错误
其他值:可以进行操作的文件描述符个数
如果想要从一个设备中读取数据,就可以定义一个fd_set变量,用来传递给readfs参数。定义好后可以使用以下几个宏进行操作:
void FD_ZERO(fd_set *set)
void FD_SET(int fd, fd_set *set)
void FD_CLR(int fd, fd_set *set)
int FD_ISSET(int fd, fd_set *set)
FD_ZERO 用于将 fd_set 变量的所有位都清零。FD_SET 用于将 fd_set 变量的某个位置 1,也就是向 fd_set 添加一个文件描述符,参数 fd 就是要加入的文件描述符。FD_CLR 用于将 fd_set变量的某个位清零,也就是将一个文件描述符从 fd_set 中删除,参数 fd 就是要删除的文件描述符。FD_ISSET 用于测试一个文件是否属于某个集合,参数 fd 就是要判断的文件描述符。
select 使用示例:
void main(void)
{
int ret, fd; /* 要监视的文件描述符 */
fd_set readfds; /* 读操作文件描述符集 */
struct timeval timeout; /* 超时结构体 */
fd = open("dev_xxx", O_RDWR | O_NONBLOCK); /* 非阻塞式访问 */
FD_ZERO(&readfds); /* 清除 readfds */
FD_SET(fd, &readfds); /* 将 fd 添加到 readfds 里面 */
/* 构造超时时间 */
timeout.tv_sec = 0;
timeout.tv_usec = 500000; /* 500ms */
ret = select(fd + 1, &readfds, NULL, NULL, &timeout);
switch (ret) {
case 0: /* 超时 */
printf("timeout!\r\n");
break;
case -1: /* 错误 */
printf("error!\r\n");
break;
default: /* 可以读取数据 */
if(FD_ISSET(fd, &readfds)) { /* 判断是否为 fd 文件描述符 */
/* 使用 read 函数读取数据 */
}
break;
}
}
②poll函数
在单个线程中,select 函数能够监视的文件描述符数量有上限,一般为 1024,可以修改内核将监视的文件描述符数量改大,但是这样会降低效率。这个时候就可以使用 poll 函数,poll 函数本质上和 select 没有太大的差别,但是 poll 函数没有最大文件描述符限制。poll函数的原型如下:
int poll(struct pollfd *fds,
nfds_t nfds,
int timeout)
参数:
fds:要监视的文件描述符集合以及要监视的事件,为一个数组,数组元素都是结构体pollfd
类型
nfds:poll 函数要监视的文件描述符数量
timeout:超时时间,单位为 ms
返回值:
返回 revents 域中不为 0 的 pollfd 结构体个数,也就是发生事件或错误的文件描述符数量;
0:超时
-1:发生错误,并且设置 errno 为错误类型
结构体pollfd:
struct pollfd {
int fd; /* 文件描述符 */
short events; /* 请求的事件 */
short revents; /* 返回的事件 */
};
fd:监视的文件描述符,如果 fd 无效那么 events 监视事件也就无效,并且 revents 返回 0。
events:监视的事件,可监视的事件类型有以下几种:
宏 | 类型 |
---|---|
POLLIN | 有数据可以读取 |
POLLPRI | 有紧急的数据需要读取 |
POLLOUT | 可以写数据 |
POLLERR | 指定的文件描述符发生错误 |
POLLHUP | 指定的文件描述符挂起 |
POLLNVAL | 无效的请求 |
POLLRDNORM | 等同于 POLLIN |
revents:返回参数,也就是返回的事件,由 Linux 内核设置具体的返回事件
poll函数使用示例:
void main(void)
{
int ret, fd; /* 要监视的文件描述符集合 */
struct pollfd fds; /* 要监视的文件描述符 */
fd = open("dev_xxx", O_RDWR | O_NONBLOCK); /* 非阻塞式访问 */
/* 构造结构体 */
fds.fd = fd;
fds.events = POLLIN; /* 监视数据是否可以读取 */
ret = poll(&fds, 1, 500); /* 轮询文件是否可操作,超时时间 500ms */
if (ret) { /* 数据有效 */
......
/* 读取数据 */
......
} else if (ret == 0) { /* 超时 */
......
} else if (ret < 0) { /* 错误 */
......
}
}
③epoll函数
传统的 selcet 和 poll 函数都会随着所监听的 fd 数量的增加,出现效率低下的问题,而且poll 函数每次必须遍历所有的描述符来检查就绪的描述符,这个过程很浪费时间。为此,epoll应运而生,epoll 就是为处理大并发而准备的,一般常常在网络编程中使用 epoll 函数。
应用程序需要先使用 epoll_create 函数创建一个 epoll 句柄:
原型:
int epoll_create(int size)
参数:
size:从 Linux2.6.8 开始此参数已经没有意义了,随便填写一个大于 0 的值就可以
返回值:epoll 句柄,如果为 -1 表示创建失败
epoll 句柄创建成功以后使用 epoll_ctl 函数向其中添加要监视的文件描述符以及监视的事件:
原型:
int epoll_ctl(int epfd,
int op,
int fd,
struct epoll_event *event)
参数:
epfd:要操作的 epoll 句柄,也就是使用 epoll_create 函数创建的 epoll 句柄
op:表示要对 epfd(epoll 句柄)进行的操作,可以设置为:
宏 | 功能 |
---|---|
EPOLL_CTL_ADD | 向 epfd 添加文件参数 fd 表示的描述符 |
EPOLL_CTL_MOD | 修改参数 fd 的 event 事件 |
EPOLL_CTL_DEL | 从 epfd 中删除 fd 描述符 |
fd:要监视的文件描述符
event: 要监视的事件类型,为epoll_event
结构体类型指针
返回值:
0:成功
-1:失败,并且设置 errno 的值为相应的错误码
epoll_event 结构体:
struct epoll_event {
uint32_t events; /* epoll 事件 */
epoll_data_t data; /* 用户数据 */
};
events 成员变量表示要监视的事件,可选的事件有以下几种:
宏 | 类型 |
---|---|
EPOLLIN | 有数据可以读取 |
EPOLLOUT | 可以写数据 |
EPOLLPRI | 有紧急的数据需要读取 |
EPOLLERR | 指定的文件描述符发生错误 |
EPOLLHUP | 指定的文件描述符挂起 |
EPOLLET | 设置 epoll 为边沿触发,默认触发模式为水平触发 |
EPOLLONESHOT | 一次性监视,当监视完成以后还需要再次监视某个 fd,那么就需要将 fd 重新添加到 epoll 中 |
一切都设置好以后应用程序就可以通过 epoll_wait 函数来等待事件的发生,类似 select 函数:
原型:
int epoll_wait(int epfd,
struct epoll_event *events,
int maxevents,
int timeout)
参数:
epfd:要等待的 epoll
events:指向 epoll_event 结构体的数组,当有事件发生时 Linux 内核会填写 events,调用者可以根据 events 判断发生了哪些事件
maxevents:events 数组大小,必须大于 0
timeout:超时时间,单位为 ms
返回值:
0:超时
-1:错误
其他:准备就绪的文件描述符数量
注:epoll 更多是用在大规模的并发服务器上,因为在这种场合下 select 和 poll 效率较低。当涉及到的文件描述符(fd)比较少的时候就适合用 selcet 和 poll。
在原子哥教程的驱动开发中,就主要使用 select 和 poll 函数。
4.Linux驱动下的poll操作函数
当应用程序调用 select 或 poll 函数来对驱动程序进行非阻塞访问时,驱动程序 file_operations 操作集中的 poll 函数就会执行。所以驱动程序的编写者需要提供对应的 poll 函数:
原型:
unsigned int (*poll) (struct file *filp, struct poll_table_struct *wait)
参数:
filp:要打开的设备文件(文件描述符)
wait:结构体 poll_table_struct 类型指针,由应用程序传递进来的。一般将此参数传递给 poll_wait 函数
返回值:
向应用程序返回设备或者资源状态,可以返回的资源状态如下:
宏 | 类型 |
---|---|
POLLIN | 有数据可以读取 |
POLLPRI | 有紧急的数据需要读取 |
POLLOUT | 可以写数据 |
POLLERR | 指定的文件描述符发生错误 |
POLLHUP | 指定的文件描述符挂起 |
POLLNVAL | 无效的请求 |
POLLRDNORM | 等同于 POLLIN,普通数据可读 |
需要在驱动程序的 poll 函数中调用 poll_wait 函数,poll_wait 函数不会引起阻塞,只是将应用程序添加到 poll_table 中,poll_wait 函数原型如下:
void poll_wait(struct file * filp,
wait_queue_head_t * wait_address,
poll_table *p)
参数:
wait_address:要添加到 poll_table 中的等待队列头
p:poll_table,也就是file_operations 中 poll 函数的 wait 参数