什么是多路复用:
- 多路: 指的是多个socket套接字网络连接;
- 复用: 指的是复用一个线程、使用一个线程来检查多个文件描述符的就绪状态
- 多路复用主要有三种技术:select,poll,epoll。目前epoll是使用最多的一种。
I/O多路复用技术的最大优势是系统开销小,系统不必创建进程/线程
select原理:
int select (int n, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
select是一种IO多路(多个TCP连接)复用技术,具体实现原理是:
- sel检测ect会维护一个文件描述符列表fd_set,用来存放需要监听的文件描述符fd,其本质是一个1024bit的bitmap数组,1代表需要的fd,0代表不需要检测的fd,初始时bitmap的元素全为1;
- 调用select开始对fd_set进行轮询,每一次轮询操作都需要将fd集合从用户态拷贝到内核态,因为检测一个fd是否有IO事件发生是由内核完成的。同时select会阻塞其他进程,直到检测到有事件发生才会返回事件个数,并修改fd_set对应的值,0表示无事件发生。由于select返回的只是事件发生的个数,所以要知道具体是哪一个fd有IO事件,还需要再次对fd_set进行轮询一遍。
缺点:
- 每次调用select都需要将文件描述符集合从用户态拷贝到内核态,在高并发场景下,开销特别大;
- select只能返回事件发生的个数,而不知晓具体哪个fd发生了IO事件,所以还需要轮询一遍;
- select可监听的文件描述符有限,一般32位下只有1024个,64位下只有2048个。虽然可以通过FD_SETSIZE函数进行修改,但是性能难免会受到影响。
- 文件描述符集合不能重用,因为每次监听都会对该集合进行修改
- 轮询机制过于耗时,尤其是当fd数量很多时
poll原理:
poll与select很相似,主要区别在于fd文件描述符集合不同,poll使用的是pollfd,是一种链式的结构,没有最大文件描述符限制。但是它与select同样存在性能问题,每一次调用都需要将文件夹描述符从内核态拷贝到用户态,增大开销,也不适于高并发的场景。
epoll原理
相比于select,epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。epoll分为LT和ET触发模式,epoll的实现就是把检测就绪队列和阻塞进程两步分离,每一个FD只会拷贝到内核中一次。
epoll在创建时调用epoll_create,创建eventpoll结构体,这个结构体中包含保存绪队列的rdlist双向链表和监视FD的数据结构红黑树。
int epoll_create(int size);
// 参数size: 用来告诉内核这个监听的数目一共有多大,
// 参数 size 并不是限制了 epoll 所能监听的描述符最大个数,
// 只是对内核初始分配内部数据结构的一个建议。
epoll_ctrl
添加/修改/删除要管理的fd
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
// epoll 的事件注册函数,它不同于 select() 是在监听事件时告诉内核要监听什么类型的事件,
// 而是在这里先注册要监听的事件类型。
// 参数epfd: epoll 专用的文件描述符,epoll_create()的返回值
// 参数op: 添加/修改/删除的操作:
// EPOLL_CTL_ADD:注册新的 fd 到 epfd 中;
// EPOLL_CTL_MOD:修改已经注册的fd的监听事件;
// EPOLL_CTL_DEL:从 epfd 中删除一个 fd;
// 参数fd: 需要监听的文件描述符
// 参数event: 告诉内核要监听什么事件
// 返回值:0表示成功,-1表示失败。
epoll_wait
用于检测等待队列,将就绪的fd放入就绪队列,并将就绪的事件数返回,通过返回的事件数进行其他操作。
int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
// 功能:等待事件的产生,收集在 epoll 监控的事件中已经发送的事件,类似于 select() 调用。
// 参数epfd: epoll 专用的文件描述符,epoll_create()的返回值
// 参数events: 分配好的 epoll_event 结构体数组,
// epoll 将会把发生的事件赋值到events 数组中
// (events 不可以是空指针,内核只负责把数据复制到这个 events 数组中,
// 不会去帮助我们在用户态中分配内存)。
// 参数maxevents: maxevents 告之内核这个 events 有多少个 。
// 参数timeout: 超时时间,单位为毫秒,为 -1 时,函数为阻塞。
// 返回值:
// 成功,表示返回需要处理的事件数目
// 返回0,表示已超时
// 返回-1,表示失败
epoll的两种模式:
LT:水平触发,当有FD被添加到就绪队列时,就可以对FD进行IO操作,如果没有操作还是会继续通知
ET:边沿触发,当有FD被添加到就绪队列时,只会对该文件描述符通知一次,直到该文件描述符不再为就绪状态了,它会默认你知道文件描述符已经就绪,并且不会再为那个文件描述符发送更多的就绪通知,直到你做了某些操作导致那个文件描述符不再为就绪状态了。期间如果没有对该套接字执行IO操作,内核也不会继续通知,这种模式下仅支持非阻塞套接字 。
三种复用对比
select | poll | epoll | |
性能 | 链接的数量越多,性能越差。不适合高并发场景 | 链接的数量越多,性能越差。不适合高并发场景 | 随着连接数的增加,性能基本没有变化 |
连接数 | 1024 | 无限制 | 无限制 |
内存拷贝 | 每次调用select拷贝 | 每次调用poll拷贝 | fd首次调用epoll_ctl拷贝,每次调用epoll_wait不拷贝 |
数据结构 | bitmap | 链表 | 红黑树 |
内在处理机制 | 线性轮询 | 线性轮询 | FD挂在红黑树,通过事件回调callback |
时间复杂度 | O(n) | O(n) | O(1) |