Linux的io多路复用
- 什么是多路io复用
在利用socketTCP通信的时候,会有两个地方阻塞,一个是accept()监听时,还有一个是recv()接收数据时。监听是监听新客户端的连接,因为无法判断什么时间会有客户端连接,所以这个函数要一个线程实时监听。接收数据是在监听到一个客户端连接后,要随时接收此客户端发来的信息,所以也需要一个线程实时监听。在不使用任何其他技术的前提下,这种情况就只能使用一个主线成+n个线程来完成实时监听,这样无疑是浪费资源的。
于是就引入了多路io复用技术。上面的问题就是无法判断什么时候客户端会发送数据,所以服务器每个线程对应的recv要一直判断。多路io复用是用一个线程来判断所有的客户端是否有消息发送,如果有就将这些客户端对应的socket放到一个队列,供编程人员进行下一步操作。
- 3种多路io复用技术及优缺点
- select
优点:
1. 跨平台
2. 代码简单,易于维护
3. 时间精度高,用于特殊场景
缺点:
4. 轮询监听socket是否有时间发生,浪费CPU资源
5. 最大监听上线为1024个socket,因为是轮询,所以不能监听太多socket防止不能及时响应消息。
6. 只返回就绪数量,需要用户轮序查看具体是哪些有事件发生。
7. select每一次监听都需要将监听队列重新加载到监听队列,浪费不必要的拷贝开销
- poll
优点:
1. 突破了1024的监听数量限制
2. 就绪事件与监听事件分离
缺点:
1. 与select缺点差不多,性能没有优化
- epoll
-
epoll是在Linux系统下开发大型项目最常用的技术,它的检测事件发生机制是通过回调的方式检测的,从而避免了轮询查看每个监听的socket是否有事件发生,这就使得多路io复用从本质上解决的监听socket数量上的上线。在只考虑并发连接数上,就只是单纯的epoll就能监听百万级的连接数。
- epoll的工作机制
- epoll是通过红黑树来管理这些监听的socket节点,为了加快节点的查询和删除操作。
- 当监听的socket有事件发生,那么对应的socket节点会通过回调机制添加到就绪队列中。