导言:大部分程序使用的I/O模型(传统的阻塞式I/O模型)都是单个进程每次只在一个文件描述符上执行I/O操作,每次I/O系统调用都会阻塞直到完成数据传输。但是,有些场景需要:
- 以非阻塞的方式检查文件描述符上是否可进行I/O操作。
- 同时检查多个文件描述符,看它们中的任何一个是否可以执行I/O操作。
对应的解决方法分别是,使用
非阻塞式I/O
和多进程(多线程)
。
- 在打开文件时设定
O_NONBLOCK
标志,会以非阻塞方式打开文件,如果I/O系统调用不能立刻完成,则会返回错误而不是阻塞进程。非阻塞式I/O可以让我们周期性地检查(轮询)某个文件描述符上是否可以执行I/O操作,但是这种人为的轮询很难控制。- 而多进程(多线程)可以满足同时检查多个文件描述符,但是开销大且复杂(编程复杂)。
因此上述两种方法都有各自的局限性,是否有更好的方法?使用I/O多路复用技术。
I/O多路复用的目标:就是同时检查多个文件描述符的状态,查看I/O系统调用是否可以非阻塞地执行。文件描述符就绪状态的转化是通过一些I/O事件来触发的,而同时检查多个文件描述符的操作,不会执行实际的I/O操作,它只是告诉进程某个文件描述符已经处于就绪状态了,需要调用其他的系统调用来完成实际的I/O操作。
- I/O多路复用允许一个进程同时检查多个文件描述符,以找出它们中的任何一个是否可执行I/O操作。select()和poll()等系统调用可以用来执行I/O多路复用。
- 信号驱动I/O,例如,当有写事件发生时,内核向进程发送一个信号。相比select()和poll()在检查大量的文件描述符时可以提升性能。
- Linux专有的epoll(2.6+内核)。当同时检查大量文件描述符时,epoll能提供更好的性能。
- POSIX异步I/O(AIO),允许进程将I/O操作排列到一个文件中,当操作完成后得到通知。目前,Linux在glibc中提供有基于线程的POSIX AIO实现。
选择哪种I/O多路复用技术和原因
- 系统调