select、poll、epoll优势和缺陷总结

Danica~

于 2024-05-04 20:09:26 发布

阅读量1k

点赞数 14

分类专栏：深入剖析muduo网络库文章标签：服务器网络

本文链接：https://blog.csdn.net/m0_62689947/article/details/138447455

版权

深入剖析muduo网络库专栏收录该内容

21 篇文章 0 订阅

订阅专栏

本文讨论了select和poll在高并发场景下的局限性，特别是文件描述符数量限制和内存拷贝问题。然后介绍了epoll的原理，强调其无限制的监视文件数量、高效性和LT/ET模式。Muduo库采用LT模式，表现出更好的性能。最后提到libevent采用ET模式，但在多线程环境下，muduo表现更优。

摘要由CSDN通过智能技术生成

1、select和poll的缺点

select的缺点

1、单个进程能够监视的文件描述符的数量存在最大限制，通常是1024，当然可以更改数量，但由于 select采用轮询的方式扫描文件描述符，文件描述符数量越多，性能越差；(在linux内核头文件中，有这样的定义：#define __FD_SETSIZE 1024

2、内核 / 用户空间内存拷贝问题，select需要复制大量的句柄数据结构，产生巨大的开销。

调用select或者poll我们需要填写相应的位数组，填写相应的数据，然后通过调用select或者poll，将句柄（文件描述符）数据从用户空间拷贝到内核空间，内核空间去监听事件是否发生，事件如果发生，再将事件从内核空间拷贝到用户空间。

3、select返回的是含有整个句柄的数组，应用程序需要遍历整个数组才能发现哪些句柄发生了事件

4、select的触发方式是水平触发，应用程序如果没有完成对一个已经就绪的文件描述符进行IO操作，那么之后每次select调用还是会将这些文件描述符通知进程

相比select模型，poll使用链表保存文件描述符，因此没有了监视文件数量的限制，但其他三个缺点依然存在。

以select模型为例，假设我们的服务器需要支持100万的并发连接，则在__FD_SETSIZE 为1024的情况下，则我们至少需要开辟1k个进程才能实现100万的并发连接。除了进程间上下文切换的时间消耗外，从内核/用户空间大量的句柄结构内存拷贝、数组轮询等，是系统难以承受的。因此，基于select模型的服务器程序，要达到100万级别的并发访问，是一个很难完成的任务。

2、epoll原理以及优势

epoll的实现机制与select/poll机制完全不同，它们的缺点在epoll上不复存在。

设想一下如下场景：有100万个客户端同时与一个服务器进程保持着TCP连接。而每一时刻，通常只有几百上千个TCP连接是活跃的(事实上大部分场景都是这种情况)。如何实现这样的高并发？

在select/poll时代，服务器进程每次都把这100万个连接告诉操作系统（从用户态复制句柄数据结构到内核态），让操作系统内核去查询这些套接字上是否有事件发生，轮询完成后，再将句柄数据复制到用户态，让服务器应用程序轮询处理已发生的网络事件，这一过程资源消耗较大，因此，select/poll一般只能处理几千的并发连接。

epoll的设计和实现与select完全不同。epoll通过在Linux内核中申请一个简易的文件系统（文件系统一般用什么数据结构实现？B+树，磁盘IO消耗低，效率很高）。

把原先的select/poll调用分成以下3个部分：

1）调用epoll_create()建立一个epoll对象（在epoll文件系统中为这个句柄对象分配资源）

2）调用epoll_ctl向epoll对象中添加这100万个连接的套接字

3）调用epoll_wait收集发生的事件的fd资源

如此一来，要实现上面说是的场景，只需要在进程启动时建立一个epoll对象，然后在需要的时候向这个epoll对象中添加或者删除事件。同时，epoll_wait的效率也非常高，因为调用epoll_wait时，并没有向操作系统复制这100万个连接的句柄数据，内核也不需要去遍历全部的连接。

epoll_create在内核上创建的eventpoll结构如下：

struct eventpoll{
    ....
    /*红黑树的根节点，这颗树中存储着所有添加到epoll中的需要监控的事件*/
    struct rb_root rbr;
    /*双链表中则存放着将要通过epoll_wait返回给用户的满足条件的事件*/
    struct list_head rdlist;
    ....
};

3、LT模式和ET模式

3.1 LT模式

水平触发，内核数据没被读完，就会一直上报数据。

3.2 ET模式

边沿触发，内核数据只上报一次。（从不可读到可读，或者从不可写到可写）

epoll的LT和ET模式介绍

3.3 muduo采用的是LT

1、不会丢失数据或者消息

应用没有读取完数据，内核是会不断上报的

2、低延迟处理

每次读数据只需要一次系统调用；照顾了多个连接的公平性，不会因为某个连接上的数据量过大而影响其他连接处理消息

3、跨平台处理

像select一样可以跨平台使用

libevent是一个C语言写的网络库，底层也是事件驱动，统一事件源的epoll，采用的是ET模式，从压测的结果来看，在单线程下，muduo库和libevent库的性能差不了多少，在多线程情况下，muduo库的吞吐量大致可以达到libevent的近2倍，性能更好。

Danica~

关注

14
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
select、poll、epoll优势和缺陷总结

在select/poll时代，服务器进程每次都把这100万个连接告诉操作系统（从用户态复制句柄数据结构到内核态），让操作系统内核去查询这些套接字上是否有事件发生，轮询完成后，再将句柄数据复制到用户态，让服务器应用程序轮询处理已发生的网络事件，这一过程资源消耗较大，因此，select/poll一般只能处理几千的并发连接。同时，epoll_wait的效率也非常高，因为调用epoll_wait时，并没有向操作系统复制这100万个连接的句柄数据，内核也不需要去遍历全部的连接。B+树，磁盘IO消耗低，效率很高）。
复制链接

扫一扫