Linux I/O模式详解
五种I/O模式
I/O操作通常分为两个阶段:
- 等待数据准备就绪
这涉及等待数据到达网络。当数据包到达时,它被复制到内核内的缓冲区中。 - 将数据复制到进程中
将(就绪)数据从内核的缓冲区复制到我们的应用程序缓冲区中。
阻塞I/O(blocking I/O)
在linux中,默认情况下所有的socket都是blocking(阻塞)。
当用户进程调用了recvfrom这个系统调用,kernel就开始了IO的第一个阶段:准备数据(对于网络IO来说,很多时候数据在一开始还没有到达。比如,还没有收到一个完整的UDP包。这个时候kernel就要等待足够的数据到来)。这个过程需要等待,也就是说数据被拷贝到操作系统内核的缓冲区中是需要一个过程的。而在用户进程这边,整个进程会被阻塞(当然,是进程自己选择的阻塞)。当kernel一直等到数据准备好了,它就会将数据从kernel中拷贝到用户内存,然后kernel返回结果,用户进程才解除block的状态,重新运行起来。
所以,blocking IO的特点就是在IO执行的两个阶段都被block了。
非阻塞I/O(nonblocking I/O)
当socket设置为非阻塞时,我们告诉内核“如果数据没有准备好请立即返回error(错误)”。
从用户进程角度讲 ,它发起一个I/O操作后,并不需要等待,而是马上就得到了一个结果。用户进程判断结果是一个error时,它就知道数据还没有准备好,于是它可以再次发送read操作。一旦kernel(内核)中的数据准备好了,并且又再次收到了用户进程的system call(系统调用),那么它马上就将数据拷贝到了用户内存,然后返回。
所以,nonblocking IO的特点是用户进程需要不断的主动询问kernel(内核)数据好了没有。
I/O多路复用(I/O multiplexing)
上图就是在这两个系统调用之一中调用或和阻塞,而不是在实际的 I/O 系统调用中阻塞。
当用户进程调用了select,那么整个进程会被block,而同时,kernel会“监视”所有select负责的socket,当任何一个socket中的数据准备好了,select就会返回。这个时候用户进程再调用read操作,将数据从kernel拷贝到用户进程。
所以,I/O 多路复用的特点是通过一种机制一个进程能同时等待多个文件描述符,而这些文件描述符(套接字描述符)其中的任意一个进入读就绪状态,select()函数就可以返回。
信号驱动I/O(signal driven I/O)
首先创建信号驱动的 I/O 套接字,并使用系统调用安装信号处理程序。从此系统调用中返回是立即的,我们的过程仍在继续;它不会被阻止。
当内核准备好数据时,就会进程生成信号,通过调用从信号处理程序读取数据报,然后通知主循环数据已准备好进行处理。
此模型的优点是,我们在等待数据报到达时不会被阻塞。主循环可以继续执行,只需等待信号处理程序通知数据已准备好处理或数据报已准备好读取。
但实际很少使用该模型。
异步I/O(asynchronous I/O)
用户进程发起read操作之后,立刻就可以开始去做其它的事。
从kernel的角度,当它受到一个异步I/O之后,首先它会立刻返回,所以不会对用户进程产生任何block。然后,kernel会等待数据准备完成,然后将数据拷贝到用户内存,当这一切都完成之后,kernel会给用户进程发送一个signal,告诉它read操作完成了。