1、什么是IO多路复用?
IO多路复用是一种同步IO模型,实现一个线程可以监视多个文件句柄;一旦某个文件句柄就绪,就能够通知应用程序进行相应的读写操作;没有文件句柄就绪时会阻塞应用程序,交出cpu。多路是指网络连接,复用指的是同一个线程
2、为什么出现IO多路复用机制?
没有IO多路复用机制时,有BIO、NIO两种实现方式,但有一些问题
同步阻塞(BIO)
- 服务端采用单线程,当accept一个请求后,在recv或send调用阻塞时,将无法accept其他请求(必须等上一个请求处recv或send完),无法处理并发
同步非阻塞(NIO)
- 服务器端当accept一个请求后,加入fds集合,每次轮询一遍fds集合recv(非阻塞)数据,没有数据则立即返回错误,
每次轮询所有fd(包括没有发生读写事件的fd)会很浪费cpu
IO多路复用(现在的做法)
- 服务器端采用单线程通过select/epoll等系统调用获取fd列表,遍历有事件的fd进行accept/recv/send,使其能
支持更多的并发连接请求
3、IO多路复用的三种实现方式
- select
- poll
- epoll
4、select函数接口
5、select使用示例
6、select缺点
- 单个进程所打开的FD是有限制的,通过FD_SETSIZE设置,默认1024
- 每次调用select,都需要把fd集合从用户态拷贝到内核态,这个开销在fd很多时会很大
- 对socket扫描时是线性扫描,采用轮询的方法,效率较低(高并发时
7、poll函数接口
8、poll使用示例
9、poll缺点
- 每次调用poll,都需要把fd集合从用户态拷贝到内核态,这个开销在fd很多时会很大
- 对socket扫描时是线性扫描,采用轮询的方法,效率较低(高并发时)
10、epoll函数接口
11、epoll使用示例
12、epoll缺点
epoll只能工作在linux下
13、epoll LT 与 ET模式的区别
- epoll有EPOLLLT和EPOLLET两种触发模式,LT是默认的模式,ET是“高速”模式。
- LT模式下,只要这个fd还有数据可读,每次 epoll_wait都会返回它的事件,提醒用户程序去操作
- ET模式下,它只会提示一次,直到下次再有数据流入之前都不会再提示了,无论fd中是否还有数据可读。所以在ET模式下,read一个fd的时候一定要把它的buffer读完,或者遇到EAGAIN错误
14、epoll应用
- redis
- nginx
15、select/poll/epoll之间的区别
select | poll | epoll | |
---|---|---|---|
数据结构 | bitmap | 数组 | 红黑树 |
最大连接数 | 1024 | 无上限 | 无上限 |
fd拷贝 | 每次调用select拷贝 | 每次调用poll拷贝 | fd首次调用epoll_ctl拷贝,每次调用epoll_wait不拷贝 |
工作效率 | 轮询:O(n) | 轮询:O(n) | 回调:O(1) |
16、IO多路复用完整代码实现
https://github.com/caijinlin/learning-pratice/tree/master/linux/io
17、高频面试题
- 什么是IO多路复用?
- nginx/redis 所使用的IO模型是什么?
- select、poll、epoll之间的区别
- epoll 水平触发(LT)与 边缘触发(ET)的区别?