什么是多路复用IO
- 是一种同步IO模型,实现一个线程可以监视多个描述符。一旦某个描述符就绪,就能通知应用程序执行相应的读操作或者写操作。没有描述符就绪时会阻塞应用程序。IO是指网络IO,多路是指多个TCP连接,复用是指复用一个或几个线程
select
- 基本原理
- 采用轮询机制,一直select函数。select会阻塞的监视三类文件描述符(可读、可写、异常),当有数据可读、可写或异常时就会返回监视到的文件描述符数量。返回后通过遍历文件描述符集合来找到就绪的描述符,进行对应的IO操作。
- 编程模型
- 把关心的描述符都放到一个描述符集合中,找出最大的描述符
- 提前保存好描述符集合,然后再内核中遍历描述符集合(循环0~maxfd次),把没有可读、可写、异常的描述符从集合中删除
- 调用FD_ISSET测试关心的描述符是否还是可读、可写、异常
- 优点
- 基本在所有的平台都能使用
- 缺点
- 因为采用的是轮询的方式全盘扫描,所以效率会随着描述符的增加而下降
- 每次调用select(),都需要把描述符集合从用户态拷贝到内核态
- 单个进程打开的描述符数量是有限制的,可以通过FD_SETSIZE设置,一般为1024
poll
- 基本原理
- 与select类似,也是轮询+遍历。但是不需要找出最大的文件描述符
- 缺点
- 采用的是轮询的方式全盘扫描,效率会随着描述符的增加而下降
- 每次调用poll,需要把描述符集合从用户态拷贝到内核态
epoll
- linux下独有的,没有fd个数的限制,使用于描述符数量多,且只有少数处于活跃的场景下
- 高并发首选epoll
epoll水平触发(LT)与边缘触发(ET)的区别
- LT是默认的模式,ET是高速模式
- LT模式下,只要这个fd还有数据可读,每次epoll_wait都会返回它的事件,提醒用户处理
- ET模式下,每次数据指挥提醒一次,直到下次有数据流之前都不会再提示了。所以ET模式下需要确保每次都把数据读完
select、poll和epoll的区别
- 支持一个进程所能打开的最大连接数
- select: 一般为1024个
- poll: 没有限制
- epoll: 没有限制
- fd增加后带来的效率问题
- select: 反比
- poll: 反比
- epoll: 在socket活跃较少的情况下没有影响,但活跃数较多就会影响效率
- 消息传递方式
- select: 内核需要将消息传递到用户空间,都需要内核拷贝动作
- poll: 同上
- epoll: 内核和用户共享一块内存