Linux 下 I/O 多路复用

在 Linux 下,I/O 多路复用是一种高效的 I/O 模型,允许一个进程监视多个文件描述符上的 I/O 事件,从而实现同时处理多个连接或文件的目的。这种机制通常与非阻塞 I/O 结合使用,可以避免使用多线程或多进程的开销,提高系统的性能和资源利用率。
在 Linux 中,常见的实现 I/O 多路复用的机制包括 select、poll 和 epoll。这些机制在实现上有所不同,但它们的基本思想都是相似的,都是通过一组系统调用来监听多个文件描述符上的 I/O 事件。

select

select 是最早的一种 I/O 多路复用机制,它使用一个 fd_set 集合来保存要监听的文件描述符,并提供 select 函数来等待这些文件描述符上的事件。select 的缺点是,它使用了线性扫描的方式来检查每个文件描述符的状态,当文件描述符数量较大时,性能会下降。

  1. 准备文件描述符集合:将要监视的文件描述符添加到相应的文件描述符集合中。通常使用 FD_SET 宏来将文件描述符添加到读集合、写集合和异常集合中。
  2. 调用 select 函数:调用 select 函数来等待文件描述符上的事件发生。select 函数会阻塞进程,直到指定的文件描述符中的一个或多个发生了事件,或者超时时间到达。
  3. 检查文件描述符状态:当 select 函数返回时,需要遍历文件描述符集合,检查每个文件描述符的状态。可以使用 FD_ISSET 宏来检查文件描述符是否在集合中。
  4. 处理事件:根据文件描述符的状态,进行相应的处理。例如,如果某个文件描述符可读,则读取数据并处理;如果可写,则写入数据;如果有异常,则处理异常等。

poll

poll 是 select 的改进版本,它使用一个 pollfd 数组来保存要监听的文件描述符,并提供 poll 函数来等待这些文件描述符上的事件。与 select 不同,poll 使用了更加高效的数据结构来管理文件描述符,性能相对较好,但仍然存在一些限制。

  1. 准备 pollfd 数组:创建一个 pollfd 数组,每个元素对应一个文件描述符,用于保存要监视的文件描述符的信息。pollfd 结构体包含了文件描述符、监视的事件和发生的事件等信息。
  2. 填充 pollfd 数组:为每个文件描述符设置要监视的事件,包括可读、可写和异常等事件。可以使用 POLLIN、POLLOUT 和 POLLERR 等宏来设置相应的事件。
  3. 调用 poll 函数:调用 poll 函数来等待文件描述符上的事件发生。poll 函数会阻塞进程,直到指定的文件描述符中的一个或多个发生了事件,或者超时时间到达。
  4. 处理事件:当 poll 函数返回时,遍历 pollfd 数组,检查每个文件描述符上发生的事件。根据事件的类型,进行相应的处理。
  5. poll 和 select 在功能上类似,但在一些方面有所不同。相对于 select,poll 的优点包括:
  • 没有文件描述符数量限制:poll 不受文件描述符数量的限制,可以监视任意数量的文件描述符。
  • 不会修改文件描述符:poll 不会修改文件描述符的状态,因此不需要重新设置文件描述符集合。
  • 没有超时参数的限制:poll 的超时参数是以毫秒为单位的整数,不像 select 那样受到秒数的限制。

epoll

epoll 是 Linux 下最先进和最高效的 I/O 多路复用机制,它引入了基于事件驱动的方式来管理文件描述符。epoll 使用一个事件表来保存要监听的文件描述符,并提供 epoll_create、epoll_ctl 和 epoll_wait 等系统调用来管理和等待事件。epoll 支持边缘触发和水平触发两种模式,性能比 select 和 poll 更好,特别是在处理大量并发连接时效果显著。

  1. 高效的事件通知机制:epoll 使用基于事件驱动的方式进行工作,只有在文件描述符上的事件发生时才会通知应用程序,避免了对所有文件描述符进行轮询的开销。
  2. 支持边缘触发和水平触发:epoll 支持边缘触发(Edge-Triggered)和水平触发(Level-Triggered)两种模式。在边缘触发模式下,只通知发生状态变化的文件描述符;在水平触发模式下,只要文件描述符处于可读或可写状态,就会通知应用程序。
  3. 单个系统调用监视多个文件描述符:epoll 可以同时监视多个文件描述符,而不需要为每个文件描述符创建一个线程。这使得 epoll 在处理大量并发连接时能够更加高效。
  4. 适用于大量并发连接:epoll 的性能优势在于它能够处理大量的并发连接,而不会因为文件描述符数量增加而降低性能。
  5. 更少的系统调用开销:相比于 select 和 poll,epoll 的系统调用开销更小,因为它使用了更高效的数据结构来管理文件描述符。
  6. epoll 的使用方式包括以下几个步骤:
    • 创建 epoll 实例:使用 epoll_create 函数创建一个 epoll 实例。
    • 向 epoll 实例注册文件描述符:使用 epoll_ctl 函数向 epoll 实例注册要监视的文件描述符,并指定要监视的事件类型(如可读、可写等)。
    • 等待事件发生:使用 epoll_wait 函数等待文件描述符上的事件发生。epoll_wait 函数会阻塞进程,直到指定的文件描述符中的一个或多个发生了事件,或者超时时间到达。
    • 处理事件:当 epoll_wait 返回时,遍历返回的事件列表,根据事件的类型进行相应的处理。
  • 综上所述,epoll 是一种高效的事件通知机制,适用于处理大量并发连接的场景,特别是在网络服务器程序中能够发挥其优势。

epoll 通讯实例 (仅供参考)

  • 这个示例程序创建了一个 TCP 服务器,监听端口号为 12345,使用 epoll 实例来进行事件监听。当有客户端连接时,将其加入 epoll 实例中,并在接收到客户端消息时进行回复。
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/epoll.h>
#include <sys/socket.h>

#define MAX_EVENTS 10
#define MAX_BUF_SIZE 1024

int main() {
    int server_fd, client_fd, epoll_fd, nfds, n;
    struct epoll_event ev, events[MAX_EVENTS];
    struct sockaddr_in server_addr, client_addr;
    socklen_t addr_len = sizeof(struct sockaddr_in);
    char buf[MAX_BUF_SIZE];

    // 创建 TCP 套接字
    server_fd = socket(AF_INET, SOCK_STREAM, 0);
    if (server_fd == -1) {
        perror("socket");
        exit(EXIT_FAILURE);
    }

    // 设置服务器地址和端口
    memset(&server_addr, 0, sizeof(server_addr));
    server_addr.sin_family = AF_INET;
    server_addr.sin_addr.s_addr = htonl(INADDR_ANY);
    server_addr.sin_port = htons(12345);

    // 绑定地址和端口
    if (bind(server_fd, (struct sockaddr *)&server_addr, sizeof(server_addr)) == -1) {
        perror("bind");
        exit(EXIT_FAILURE);
    }

    // 监听端口
    if (listen(server_fd, SOMAXCONN) == -1) {
        perror("listen");
        exit(EXIT_FAILURE);
    }

    // 创建 epoll 实例
    epoll_fd = epoll_create1(0);
    if (epoll_fd == -1) {
        perror("epoll_create1");
        exit(EXIT_FAILURE);
    }

    // 将监听套接字加入 epoll 实例中
    ev.events = EPOLLIN;
    ev.data.fd = server_fd;
    if (epoll_ctl(epoll_fd, EPOLL_CTL_ADD, server_fd, &ev) == -1) {
        perror("epoll_ctl: server_fd");
        exit(EXIT_FAILURE);
    }

    printf("Server started. Waiting for connections...\n");

    while (1) {
        // 等待事件发生
        nfds = epoll_wait(epoll_fd, events, MAX_EVENTS, -1);
        if (nfds == -1) {
            perror("epoll_wait");
            exit(EXIT_FAILURE);
        }

        // 处理所有就绪事件
        for (int i = 0; i < nfds; ++i) {
            if (events[i].data.fd == server_fd) {
                // 新的连接请求
                client_fd = accept(server_fd, (struct sockaddr *)&client_addr, &addr_len);
                if (client_fd == -1) {
                    perror("accept");
                    exit(EXIT_FAILURE);
                }

                printf("New connection from %s:%d\n", inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port));

                // 将客户端套接字加入 epoll 实例中
                ev.events = EPOLLIN;
                ev.data.fd = client_fd;
                if (epoll_ctl(epoll_fd, EPOLL_CTL_ADD, client_fd, &ev) == -1) {
                    perror("epoll_ctl: client_fd");
                    exit(EXIT_FAILURE);
                }
            } else {
                // 客户端发送数据
                memset(buf, 0, sizeof(buf));
                n = read(events[i].data.fd, buf, sizeof(buf));
                if (n <= 0) {
                    // 客户端断开连接
                    if (n == 0) {
                        printf("Connection closed by client\n");
                    } else {
                        perror("read");
                    }

                    // 关闭客户端套接字并从 epoll 实例中删除
                    close(events[i].data.fd);
                    epoll_ctl(epoll_fd, EPOLL_CTL_DEL, events[i].data.fd, NULL);
                } else {
                    // 收到客户端消息,回复消息
                    printf("Received message from client: %s\n", buf);
                    write(events[i].data.fd, buf, strlen(buf));
                }
            }
        }
    }

    // 关闭监听套接字和 epoll 实例
    close(server_fd);
    close(epoll_fd);

    return 0;
}

  • 7
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值