浅谈IO多路复用

威桑

已于 2024-05-22 15:37:57 修改

阅读量605

点赞数 13

分类专栏： C++ 计算机文章标签： IO多路复用 c++ 计算机

于 2024-05-22 13:11:51 首次发布

本文链接：https://blog.csdn.net/m0_74091159/article/details/139117138

版权

C++ 同时被 2 个专栏收录

41 篇文章 0 订阅

订阅专栏

计算机

18 篇文章 0 订阅

订阅专栏

什么事IO多路复用？

IO多路复用是一种同步IO模型,它可以让一个线程监视多个文件描述符(Socket)的就绪状态。当有一个或多个文件描述符就绪时,内核会通知应用程序,然后应用程序可以进行相应的读写操作。如果没有文件描述符就绪,线程就会阻塞,从而释放CPU资源。

在现代操作系统中，实现IO多路复用的主要模型有三种:

select：这是最早期的IO多路复用机制，定义在POSIX标准中。select函数允许程序监视多个文件描述符以查看是否有数据可读、可写或有错误发生。它的主要缺点是对于大数量的文件描述符，效率较低，因为每次调用都需要重新扫描文件描述符集。
poll：类似于select，但使用不同的数据结构，可以支持更多的文件描述符。poll函数接受一个文件描述符数组，并返回那些已经准备好的文件描述符。同样，poll的效率在处理大量文件描述符时也不是很高。
epoll：这是Linux特有的、比select和poll更高效的IO多路复用机制。epoll提供了一组函数（如epoll_create、epoll_ctl、epoll_wait），并且其内部使用一个更高效的数据结构（红黑树和链表），使得它在处理大量文件描述符时性能更好。与select和poll不同，epoll在监视的文件描述符集发生变化时不需要重新扫描整个集。

IO多路复用的核心思想是利用一个线程来检查多个文件描述符的就绪状态,从而减少线程数量和上下文切换开销。它通过select、poll或epoll等系统调用,将多个文件描述符集中到一起监视,只有当有文件描述符就绪时,才会被唤醒进行后续操作。

工作原理

IO多路复用的工作原理主要分为以下几个步骤：

注册文件描述符：程序将需要监视的文件描述符注册到多路复用的机制中，比如epoll或select。
等待事件：多路复用机制会阻塞程序，并等待注册的文件描述符中有一个或多个准备好进行I/O操作。
处理事件：当某些文件描述符准备好进行I/O操作时，多路复用机制会返回这些文件描述符，程序接着处理这些I/O事件。
重复循环：程序可以继续注册新的文件描述符并重复上述过程。

优点

高效资源利用：避免程序在等待I/O操作时被阻塞，从而更有效地利用CPU和其他资源。
可扩展性：在处理大量并发连接时表现良好，特别是epoll，适用于高并发服务器。

缺点

(select/poll)需要遍历socket查看有无监听的事件发生，时间复杂度为O（n），浪费CPU资源,重复传递数据。因为内核是无状态的，每次都要根据进程不断重复从用户态向内核态传递所有的socket号去遍历每一个socket，获取它们的状态。
(epoll)如果当epoll_wait()方法返回了10w个就绪事件，就需要等待这10w个就绪事件处理完成，才能继续下面的命令，去响应新的事件，这样就容易让新的事件超时。因此，提出了Reactor模型。

示例代码

下面是使用epoll的一个简单示例（使用C语言）：

#include <sys/epoll.h>
#include <unistd.h>
#include <fcntl.h>
#include <stdio.h>
#include <stdlib.h>

#define MAX_EVENTS 10

int main() {
    int epoll_fd = epoll_create1(0);
    if (epoll_fd == -1) {
        perror("epoll_create1");
        exit(EXIT_FAILURE);
    }

    struct epoll_event ev, events[MAX_EVENTS];
    int listen_sock = /* listening socket initialization */;
    ev.events = EPOLLIN;
    ev.data.fd = listen_sock;
    if (epoll_ctl(epoll_fd, EPOLL_CTL_ADD, listen_sock, &ev) == -1) {
        perror("epoll_ctl: listen_sock");
        exit(EXIT_FAILURE);
    }

    for (;;) {
        int nfds = epoll_wait(epoll_fd, events, MAX_EVENTS, -1);
        if (nfds == -1) {
            perror("epoll_wait");
            exit(EXIT_FAILURE);
        }

        for (int n = 0; n < nfds; ++n) {
            if (events[n].data.fd == listen_sock) {
                // Handle new connection
            } else {
                // Handle data from a connected socket
            }
        }
    }

    close(epoll_fd);
    return 0;
}

以上代码展示了如何使用epoll来监视一个监听套接字以及处理新连接和数据读写的基本过程。

使用时机：

选择 select/poll 还是 epoll 取决于多个因素，包括程序的规模、性能要求、操作系统环境等。下面列出了一些常见的选择标准和使用场景：

什么时候使用 `select` / `poll`

兼容性需求：select 和 poll 是 POSIX 标准的一部分，几乎在所有类 Unix 系统上都可以使用，包括一些较旧的系统。这使得它们在需要跨平台兼容性时成为优选。
文件描述符数量少：当需要监视的文件描述符数量较少（例如几十个以内），select 和 poll 的性能是可以接受的。这时，它们的简单性和广泛支持是有优势的。
简单的应用程序：对于一些简单的、低负载的网络应用或 I/O 处理程序，select 和 poll 已经足够，不需要复杂的设置和更高的性能优化。

什么时候使用 `epoll`

大量文件描述符：epoll 在处理大量文件描述符（成千上万）时性能优异。它的事件通知机制和高效的数据结构使其在高并发场景下表现更好。
Linux 环境：epoll 是 Linux 特有的 I/O 多路复用机制，如果你的程序只需运行在 Linux 系统上，使用 epoll 可以获得最佳性能。
高性能要求：对于高性能服务器、网络代理服务器、大量并发连接的处理等场景，epoll 提供了更高的效率。特别是使用边缘触发模式（ET）时，可以进一步减少系统调用的次数，提高吞吐量。
事件驱动模型：如果你的程序设计是事件驱动的，epoll 的事件通知机制会更加高效和自然。