linux阻塞IO和非阻塞IO

阻塞和非阻塞简介

阻塞IO示意图:
在这里插入图片描述
当访问设备时,设备不可用,阻塞式IO则会将应用程序对应的线程挂起,直到设备资源可用为止。

非阻塞IO示意图:
在这里插入图片描述
对于非阻塞 IO,应用程序对应的线程不会挂起,它要么一直轮询等待,直到设备资源可以使用,要么就直接放弃。在上面的示意图中,应用程序使用非阻塞访问方式从设备读取数据,当设备不可用或数据未准备好的时候会立即向内核返回一个错误码,表示数据读取失败。应用程序会再次重新读取数据,这样一直往复循环,直到数据读取成功。

应用程序阻塞读取数据:

int fd;
int data = 0;
fd = open("/dev/xxx_dev", O_RDWR);  /* 阻塞方式打开 */
ret = read(fd, &data, sizeof(data));  /* 读取数据 */

应用程序非阻塞读取数据:

int fd;
int data = 0;
fd = open("/dev/xxx_dev", O_RDWR | O_NONBLOCK); /* 非阻塞方式打开 */
ret = read(fd, &data, sizeof(data)); /* 读取数据 */

使用 open 函数打开“/dev/xxx_dev”设备文件的时候添加了参数“O_NONBLOCK”,
表示以非阻塞方式打开设备,这样从设备中读取数据的时候就是非阻塞方式的了。

等待队列(阻塞IO)

等待队列头

阻塞访问最大的好处就是当设备文件不可操作的时候进程可以进入休眠态,这样可以将CPU 资源让出来。但是,当设备文件可以操作的时候就必须唤醒进程,一般在中断函数里面完成唤醒工作。Linux 内核提供了等待队列(wait queue)来实现阻塞进程的唤醒工作,如果我们要在驱动中使用等待队列,必须创建并初始化一个等待队列头,等待队列头使用结构体wait_queue_head_t 表示,wait_queue_head_t 结构体定义在文件 include/linux/wait.h 中。

struct __wait_queue_head {
	spinlock_t lock;
	struct list_head task_list;
};
typedef struct __wait_queue_head wait_queue_head_t;

定义好等待队列头以后需要初始化,使用 init_waitqueue_head 函数初始化等待队列头:

void init_waitqueue_head(wait_queue_head_t *q)
# 参数 q 就是要初始化的等待队列头。

也可以使用宏DECLARE_WAIT_QUEUE_HEAD 来一次性完成等待队列头的定义的初始化。

等待队列项

等待队列头就是一个等待队列的头部,每个访问设备的进程都是一个队列项,当设备不可用的时候就要将这些进程对应的等待队列项添加到等待队列里面。结构体 wait_queue_t 表示等待队列项:

struct __wait_queue {
	unsigned int       flags;
	void               *private;
	wait_queue_func_t  func;
	struct list_head   task_list;
	};
typedef struct __wait_queue wait_queue_t;

使用宏 DECLARE_WAITQUEUE 定义并初始化一个等待队列项,宏的内容如下:

DECLARE_WAITQUEUE(name, tsk)

name 就是等待队列项的名字,tsk 表示这个等待队列项属于哪个任务(进程),一般设置为current , 在 Linux 内核中 current 相当于一个全局变量 ,表示当前进程 。因此宏 DECLARE_WAITQUEUE 就是给当前正在运行的进程创建并初始化了一个等待队列项。

将队列项添加/移除至等待队列头

当设备不可访问的时候就需要将进程对应的等待队列项添加到前面创建的等待队列头中,
只有添加到等待队列头中以后进程才能进入休眠态。当设备可以访问以后再将进程对应的等待
队列项从等待队列头中移除即可,等待队列项添加 API 函数如下:

void add_wait_queue(wait_queue_head_t *q, wait_queue_t *wait)
q:等待队列项要加入的等待队列头。
wait:要加入的等待队列项。
返回值:无。

等待队列项移除 API 函数如下:

void remove_wait_queue(wait_queue_head_t *q, wait_queue_t *wait)
q:要删除的等待队列项所处的等待队列头。
wait:要删除的等待队列项。
返回值:无。

等待唤醒

当设备可以使用的时候就要唤醒进入休眠态的进程,唤醒可以使用如下两个函数:

void wake_up(wait_queue_head_t *q)
void wake_up_interruptible(wait_queue_head_t *q)

参数 q 就是要唤醒的等待队列头,这两个函数会将这个等待队列头中的所有进程都唤醒。wake_up 函数可以唤醒处于 TASK_INTERRUPTIBLE 和 TASK_UNINTERRUPTIBLE 状态的进程,而 wake_up_interruptible 函数只能唤醒处于 TASK_INTERRUPTIBLE 状态的进程。

等待事件

除了主动唤醒以外,也可以设置等待队列等待某个事件,当这个事件满足以后就自动唤醒等待队列中的进程。
在这里插入图片描述在这里插入图片描述
总结:采用阻塞IO方式时,需要将获取资源失败的进程进行休眠,在资源可用时唤醒休眠的进程,linux中可以采用等待队列的方式,将进程与等待队列项绑定,当进程需要休眠时将此等待队列项插入到等待队列头中,当资源可用时,将该等待队列项从等待队列头中移除,并且调用wake_up(q)主动唤醒进程,或者为等待队列设置等待事件,当条件成立,自动唤醒进程。

轮询(非阻塞IO)

如果用户应用程序以非阻塞的方式访问设备,设备驱动程序就要提供非阻塞的处理方式,也就是轮询。poll、epoll 和 select 可以用于处理轮询,应用程序通过 select、epoll 或 poll 函数来查询设备是否可以操作,如果可以操作的话就从设备读取或者向设备写入数据。当应用程序调用 select、epoll 或 poll 函数的时候设备驱动程序中的 poll 函数就会执行,因此需要在设备驱动程序中编写 poll 函数。

select
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout)

nfds:所要监视的这三类文件描述集合中,最大文件描述符加 1。
readfds、writefds 和 exceptfds:这三个指针指向描述符集合,这三个参数指明了关心哪些
描述符、需要满足哪些条件等等,这三个参数都是 fd_set 类型的,fd_set 类型变量的每一个位
都代表了一个文件描述符。readfds 用于监视指定描述符集的读变化,也就是监视这些文件是否
可以读取,只要这些集合里面有一个文件可以读取那么 seclect 就会返回一个大于 0 的值表示文
件可以读取。如果没有文件可以读取,那么就会根据 timeout 参数来判断是否超时。可以将 readfs
设置为 NULL,表示不关心任何文件的读变化。writefds 和 readfs 类似,只是 writefs 用于监视
这些文件是否可以进行写操作。exceptfds 用于监视这些文件的异常。
比如我们现在要从一个设备文件中读取数据,那么就可以定义一个 fd_set 变量,这个变量
要传递给参数 readfds。当我们定义好一个 fd_set 变量以后可以使用如下所示几个宏进行操作:

void FD_ZERO(fd_set *set)
void FD_SET(int fd, fd_set *set)
void FD_CLR(int fd, fd_set *set)
int FD_ISSET(int fd, fd_set *set)

FD_ZERO 用于将 fd_set 变量的所有位都清零,FD_SET 用于将 fd_set 变量的某个位置 1,也就是向 fd_set 添加一个文件描述符,参数 fd 就是要加入的文件描述符。FD_CLR 用于将 fd_set 变量的某个位清零,也就是将一个文件描述符从 fd_set 中删除,参数 fd 就是要删除的文件描述符。FD_ISSET 用于测试一个文件是否属于某个集合,参数 fd 就是要判断的文件描述符。timeout:超时时间,当我们调用 select 函数等待某些文件描述符可以设置超时时间,超时时间使用结构体 timeval 表示,结构体定义如下所示:

struct timeval {
	long tv_sec; /* 秒 */
	long tv_usec; /* 微妙 */
};

当 timeout 为 NULL 的时候就表示无限期的等待。
返回值:0,表示的话就表示超时发生,但是没有任何文件描述符可以进行操作;-1,发生错误;其他值,可以进行操作的文件描述符个数。

demo:

void main(void)
{
	int ret, fd; /* 要监视的文件描述符 */
	fd_set readfds; /* 读操作文件描述符集 */
	struct timeval timeout; /* 超时结构体 */
	fd = open("dev_xxx", O_RDWR | O_NONBLOCK); /* 非阻塞式访问 */
	FD_ZERO(&readfds); /* 清除 readfds */
	FD_SET(fd, &readfds); /* 将 fd 添加到 readfds 里面 */
	/* 构造超时时间 */
	timeout.tv_sec = 0;
	timeout.tv_usec = 500000; /* 500ms */
	ret = select(fd + 1, &readfds, NULL, NULL, &timeout);
switch (ret) {
	case 0:
		/* 超时 */
		printf("timeout!\r\n");
		break;
	case -1:
		/* 错误 */
		printf("error!\r\n");
		break;
	default:
		/* 可以读取数据 */
		if(FD_ISSET(fd, &readfds)) /* 判断是否为 fd 文件描述符 */
		{ 
			/* 使用 read 函数读取数据 */
		}
		break;
	}
}
poll

在单个线程中,select 函数能够监视的文件描述符数量有最大的限制,一般为 1024,可以
修改内核将监视的文件描述符数量改大,但是这样会降低效率!这个时候就可以使用 poll 函数,
poll 函数本质上和 select 没有太大的差别,但是 poll 函数没有最大文件描述符限制,Linux 应用
程序中 poll 函数原型如下所示:

int poll(struct pollfd *fds, nfds_t nfds, int timeout)

fds:要监视的文件描述符集合以及要监视的事件,为一个数组,数组元素都是结构体 pollfd
类型的,pollfd 结构体如下所示:

struct pollfd {
int fd; /* 文件描述符 */
short events; /* 请求的事件 */
short revents; /* 返回的事件 */
};

fd 是要监视的文件描述符,如果 fd 无效的话那么 events 监视事件也就无效,并且 revents 返回 0。events 是要监视的事件,可监视的事件类型如下所示:

POLLIN   有数据可以读取。
POLLPRI  有紧急的数据需要读取。
POLLOUT  可以写数据。
POLLERR  指定的文件描述符发生错误。
POLLHUP  指定的文件描述符挂起。
POLLNVAL  无效的请求。
POLLRDNORM 等同于 POLLIN

revents 是返回参数,也就是返回的事件,由 Linux 内核设置具体的返回事件。
nfds:poll 函数要监视的文件描述符数量。
timeout:超时时间,单位为 ms。
返回值:返回 revents 域中不为 0 的 pollfd 结构体个数,也就是发生事件或错误的文件描述符数量;0:超时;-1:发生错误,并且设置 errno 为错误类型。

demo:

void main(void)
{
	int ret;
	int fd; /* 要监视的文件描述符 */
	struct pollfd fds;
	fd = open(filename, O_RDWR | O_NONBLOCK); /* 非阻塞式访问 */
	/* 构造结构体 */
	fds.fd = fd;
	fds.events = POLLIN; /* 监视数据是否可以读取 */
	ret = poll(&fds, 1, 500); /* 轮询文件是否可操作,超时 500ms */
	if (ret) {  /* 数据有效 */
		......
		/* 读取数据 */
		......
	} else if (ret == 0) { /* 超时 */
		......
	} else if (ret < 0) { /* 错误 */
		......
	}
}
epoll

传统的 selcet 和 poll 函数都会随着所监听的 fd 数量的增加,出现效率低下的问题,而且poll 函数每次必须遍历所有的描述符来检查就绪的描述符,这个过程很浪费时间。为此,epoll应运而生,epoll 就是为处理大并发而准备的,一般常常在网络编程中使用 epoll 函数。应用程序需要先使用 epoll_create 函数创建一个 epoll 句柄,epoll_create 函数原型如下:

int epoll_create(int size)

size:从 Linux2.6.8 开始此参数已经没有意义了,随便填写一个大于 0 的值就可以。
返回值:epoll 句柄,如果为-1 的话表示创建失败。
epoll 句柄创建成功以后使用 epoll_ctl 函数向其中添加要监视的文件描述符以及监视的事件,epoll_ctl 函数原型如下所示:

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event)

epfd:要操作的 epoll 句柄,也就是使用 epoll_create 函数创建的 epoll 句柄。
op:表示要对 epfd(epoll 句柄)进行的操作,可以设置为:

EPOLL_CTL_ADD   向 epfd 添加文件参数 fd 表示的描述符。
EPOLL_CTL_MOD   修改参数 fd 的 event 事件。
EPOLL_CTL_DEL   从 epfd 中删除 fd 描述符。

fd:要监视的文件描述符。
event:要监视的事件类型,为 epoll_event 结构体类型指针,epoll_event 结构体类型如下所
示:

struct epoll_event {
	uint32_t events;   /* epoll 事件 */
	epoll_data_t data;   /* 用户数据 */
};

结构体 epoll_event 的 events 成员变量表示要监视的事件,可选的事件如下所示:

EPOLLIN  有数据可以读取。
EPOLLOUT  可以写数据。
EPOLLPRI 有紧急的数据需要读取。
EPOLLERR 指定的文件描述符发生错误。
EPOLLHUP 指定的文件描述符挂起。
EPOLLET  设置 epoll 为边沿触发,默认触发模式为水平触发。
EPOLLONESHOT 一次性的监视,当监视完成以后还需要再次监视某个 fd,那么就需要将 fd 重新添加到 epoll 里面。

上面这些事件可以进行“或”操作,也就是说可以设置监视多个事件。
返回值:0,成功;-1,失败,并且设置 errno 的值为相应的错误码。
一切都设置好以后应用程序就可以通过 epoll_wait 函数来等待事件的发生,类似 select 函数。epoll_wait 函数原型如下所示:

int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout)

epfd:要等待的 epoll。
events:指向 epoll_event 结构体的数组,当有事件发生的时候 Linux 内核会填写 events,调
用者可以根据 events 判断发生了哪些事件。
maxevents:events 数组大小,必须大于 0。
timeout:超时时间,单位为 ms。
返回值:0,超时;-1,错误;其他值,准备就绪的文件描述符数量。

Linux 驱动下的 poll 操作函数

当应用程序调用 select 或 poll 函数来对驱动程序进行非阻塞访问的时候,驱动程序 file_operations 操作集中的 poll 函数就会执行。所以驱动程序的编写者需要提供对应的 poll 函数,poll 函数原型如下所示:

unsigned int (*poll) (struct file *filp, struct poll_table_struct *wait)

函数参数和返回值含义如下:
filp:要打开的设备文件(文件描述符)。
wait:结构体 poll_table_struct 类型指针,由应用程序传递进来的。一般将此参数传递给 poll_wait 函数。
返回值:向应用程序返回设备或者资源状态,可以返回的资源状态如下:

POLLIN 有数据可以读取。
POLLPRI 有紧急的数据需要读取。
POLLOUT 可以写数据。
POLLERR 指定的文件描述符发生错误。
POLLHUP 指定的文件描述符挂起。
POLLNVAL 无效的请求。
POLLRDNORM 等同于 POLLIN,普通数据可读

我们需要在驱动程序的 poll 函数中调用 poll_wait 函数,poll_wait 函数不会引起阻塞,只是将应用程序添加到 poll_table 中,poll_wait 函数原型如下:

void poll_wait(struct file * filp, wait_queue_head_t * wait_address, poll_table *p)

参数 wait_address 是要添加到 poll_table 中的等待队列头,参数 p 就是 poll_table,就是 file_operations 中 poll 函数的 wait 参数。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值