C++网络编程(三)IO复用

registor11

已于 2023-03-11 23:48:12 修改

阅读量562

点赞数 1

文章标签： c++ 网络

于 2023-03-11 23:45:20 首次发布

本文链接：https://blog.csdn.net/QYQHxyh/article/details/129470702

版权

C++网络编程(三)IO复用

前言

多进程/多线程网络服务端在创建进程/线程时，CPU和内存开销很大。因为多线程/进程并发模型，为每个socket分配一个线程/进程。而IO复用采用单个的进程/线程就可以管理多个socket。

select

系统调用原型：

#include <sys/select.h>
int select(int nfds,fd_set*readfds, fd_set* writefds, fd_set* exceptfds, struct timeval* timeout);

ndfs参数指定被监听的文件描述符总数，通常设置为select监听的所有文件描述符中最大值+1,因为文件描述符从0开始编号。

readfds,writefds,exceptfds参数指向可读，可写，异常等事件对应的文件描述符集合。他们将各自感兴趣的文件描述符传入函数，当select调用返回时，内核将修改他们来通知程序哪些文件描述符已经就绪。

#include <typesizes.h>
#define __FD_SETSIZE 1024
#include <sys/select.h>
#define FD_SETSIZE __FD_SETSIZE
typedef long int __fd_mask;
#undef __NFDBITS
#define __NFDBITS (8*(int)sizeof(__fd_mask))
typedef struct
{
#ifdef __USE_XOPEN
   __fd_mask fds_bits[__FD_SETSIZE/__NFDBITS];
   #define __FDS_BITS (set)((set)->fds_bits)
#else
   __fd_mask __fds_bits[__FD_SETSIZE/__NFDBITS];
   #define __FDS_BITS (set)((set)->__fds_bits)
#endif
}fd_set;

fd_set结构体仅包含一个整型数组，该数组的每个元素的每一位（bit）标记一个文件描述符。fd_set能容纳的文件描述符数量由FD_SETSIZE指定。

对于fd_set结构体中的位操作，有设置对应的宏进行处理：

#include <sys/select.h>
FD_ZERO(fd_set* fdset);/*清除fdset的所有位*/
FD_SET(int fd, fd_set* fdset);/*设置fdset的位fd*/
FD_CLR(int fd, fd_set* fdset);/*清除fdset的位fd*/
int FD_ISSET(int fd, fd_set* fdset);/*测试fdset的位fd是否被设置*/

timeout参数用来设置select的超时时间。它是一个timeval结构类型的指针，采用指针参数是因为内核将修改它以告诉应用程序select等待了多久。不过我们不能完全信任select调用返回后的timeout值，比如调用失败时timeout值是不确定的。timeval结构体的定义如下：

struct timeval
{
    long tv_sec;/*秒数*/
    long tv_usec;/*微秒数*/
};

如果给timeout变量的tv_sec成员和tv_usec成员都传递0，则select将立即返回。如果给timeout传递NULL，则select将一直阻塞，直到某个文件描述符就绪。

select成功时返回就绪文件描述符的总数。失败返回-1并设置errno。如果是在select等待期间，程序接收到信号，则select立即返回-1,并设置errno为EINTR。

select流程

请添加图片描述

文件描述符就绪条件

在网络编程中，下列情况下socket可读：

socket内核接收缓存区中的字节数大于或等于其低水位标记SO_RCVLOWAT。此时我们可以无阻塞地读该socket，并且读操作返回的字节数大于0。
socket通信的对方关闭连接。此时对该socket的读操作将返回0。
监听socket上有新的连接请求。
socket上有未处理的错误。此时我们可以使用getsockopt来读取和清除该错误。

下列情况下socket可写：

socket内核发送缓存区中的可用字节数大于或等于其低水位标记SO_SNDLOWAT。此时我们可以无阻塞地写该socket，并且写操作返回的字节数大于0。
socket的写操作被关闭。对写操作被关闭的socket执行写操作将触发一个SIGPIPE信号。
socket使用非阻塞connect连接成功或者失败（超时）之后。
socket上有未处理的错误。此时我们可以使用getsockopt来读取和清除该错误。

网络程序中，select能处理的异常情况只有一种：socket上接收到带外数据。

位图

select中对文件描述符是否有改动是用位图进行标记的，即用一位表示一个文件描述符，当其中某一位发生改变时，说明对应的文件描述符有相应的事件发生。但值得注意的是，这一次改变后，在下一轮的select调用前需要先将其重置。

示例代码

//server.cpp
#include <bits/stdc++.h>
#include <cstring>
#include <errno.h>
#include <netinet/in.h>
#include <sys/select.h>
#include <sys/socket.h>
#include <sys/types.h>

using namespace std;

int main()
{
    int sock = socket(AF_INET, SOCK_STREAM, 0);
    if (sock == -1)
    {
        cout << "创建socket失败：" << strerror(errno) << endl;
        exit(0);
    }
    sockaddr_in addr;
    bzero(&addr, 0);

    addr.sin_family = AF_INET;
    addr.sin_addr.s_addr = htonl(INADDR_ANY); // 自动获取主机ip
    addr.sin_port = htons(8000);

    int ret;

    ret = bind(sock, (struct sockaddr *)&addr, sizeof(addr));
    if (ret == -1)
    {
        cout << "绑定socket失败：" << strerror(errno) << endl;
        exit(0);
    }
    ret = listen(sock, 10);
    if (ret == -1)
    {
        cout << "监听socket失败：" << strerror(errno) << endl;
        exit(0);
    }
    cout << "初始化完成" << endl;

    fd_set readset;
    char buff[4096];
    list<int> sock_list;

    while (1)
    {
        FD_ZERO(&readset);
        FD_SET(sock, &readset);//设置监听socket
        int nfds = sock;

        for (int it : sock_list) //计算最大的fd值
        {
            nfds = max(nfds, it);
            FD_SET(it, &readset);//
        }
        ret = select(nfds + 1, &readset, NULL, NULL, NULL);

        if (ret == -1)
        {
            cout << strerror(errno) << endl;
            break;
        }
        else
        {
            if (FD_ISSET(sock, &readset)) // 有新的连接请求
            {
                int clientfd = accept(sock, NULL, 0);
                cout << "new connect: " << clientfd << endl;
                sock_list.push_back(clientfd);
            }
            else{
                for (auto fd : sock_list) // 轮询所有的连接
                {
                    if (FD_ISSET(fd, &readset))
                    {
                        int len = recv(fd, buff, 4096, 0);
                        if (len <= 0)
                        {
                            sock_list.remove(fd);
                            cout << fd << " exit" << endl;
                        }
                        else
                        {
                            buff[len] = 0;
                            cout << "receive message:" << buff << endl;
                        }
                        //break;
                        //注释掉break即一轮select中可能不止一个socket有事件发生,但即是不予注释，数据仍不会丢失，select采用的是电平触发的方式。
                    }
                }
            }
        }
    }
    return 0;
}

//client.cpp
#include <arpa/inet.h>
#include <bits/stdc++.h>
#include <cstring>
#include <errno.h>
#include <netinet/in.h>
#include <netinet/tcp.h>
#include <sys/select.h>
#include <sys/socket.h>
#include <sys/types.h>

using namespace std;

int main()
{
    int sock = socket(AF_INET, SOCK_STREAM, 0);
    if (sock == -1)
    {
        cout << "创建socket失败：" << strerror(errno) << endl;
        exit(0);
    }
    sockaddr_in addr;
    bzero(&addr, 0);

    addr.sin_family = AF_INET;
    addr.sin_addr.s_addr = inet_addr("127.0.0.1");
    addr.sin_port = htons(8000);

    if (connect(sock, (sockaddr *)&addr, sizeof(addr)) == -1)
    {
        cout << "连接失败：" << strerror(errno) << endl;
        exit(0);
    }
    cout << "连接成功" << endl;
    char buff[4096];

    while (1)
    {
        cin >> buff;
        if (send(sock, buff, strlen(buff), 0) <= 0)
        {
            cout << "发送失败" << endl;
            break;
        }
        cout << "发送成功" << endl;
    }
    close(sock);
    return 0;
}

poll

poll系统调用和select极其类似，也是在指定时间内轮询一定数量的文件描述符，以测试其中是否有就绪者。poll的原型如下：

#include <poll.h>
int poll(struct pollfd* fds, nfds_t nfds, int timeout);

fds参数是一个pollfd结构体的数组，指定所有我们感兴趣的文件描述符上发生的可读、可写和异常等事件。pollfd结构体的定义如下：

struct pollfd
{
   int fd;/*文件描述符*/
   short events;/*注册的事件*/
   short revents;/*实际发生的事件，由内核填充*/
};

fd成员指定文件描述符；

events成员告诉poll监听fd上的哪些事件，它是一系列事件的按位或；

revents成员则由内核修改，以通知应用程序fd上实际发生了哪些事件。

请添加图片描述

nfds参数指定被监听事件集合fds的大小。其类型nfds_t的定义如下：

typedef unsigned long int nfds_t;

timeout参数指定poll的超时值，单位是毫秒。当timeout为-1时，poll调用将永远阻塞，直到某个事件发生；当timeout为0时，poll调用将立即返回。

poll系统调用的返回值的含义与select相同。

示例

//server.cpp
#include <bits/stdc++.h>
#include <cstring>
#include <errno.h>
#include <netinet/in.h>
#include <poll.h>
#include <sys/socket.h>
#include <sys/types.h>

using namespace std;

int main()
{
    int sock = socket(AF_INET, SOCK_STREAM, 0);
    if (sock == -1)
    {
        cout << "创建socket失败：" << strerror(errno) << endl;
        exit(0);
    }
    sockaddr_in addr;
    bzero(&addr, 0);

    addr.sin_family = AF_INET;
    addr.sin_addr.s_addr = htonl(INADDR_ANY); // 自动获取主机ip
    addr.sin_port = htons(8000);

    int ret;

    ret = bind(sock, (struct sockaddr *)&addr, sizeof(addr));
    if (ret == -1)
    {
        cout << "绑定socket失败：" << strerror(errno) << endl;
        exit(0);
    }
    ret = listen(sock, 10);
    if (ret == -1)
    {
        cout << "监听socket失败：" << strerror(errno) << endl;
        exit(0);
    }
    cout << "初始化完成" << endl;

    pollfd pfd[64];
    int nfds = 1;
    pfd[0].fd = sock;
    pfd[0].events = POLLIN;
    char buff[4096];

    while (1)
    {
        int ret = poll(pfd, nfds, -1);
        if (ret == -1)
        {
            cout << strerror(errno) << endl;
            break;
        }
        else
        {
            if (pfd[0].revents & (POLLIN)) // 有新的连接请求
            {
                int clientfd = accept(sock, NULL, 0);
                if (nfds < 64)
                {
                    cout << "new connect: " << clientfd << endl;
                    pfd[nfds].fd = clientfd;
                    pfd[nfds].events = POLLIN | POLLRDHUP;
                    nfds++;
                }
                else
                    close(clientfd);
            }
            else
            {
                for (int i = 1; i < nfds; i++)
                {
                    if (pfd[i].revents & POLLRDHUP) // 断开连接
                    {
                        cout << pfd[i].fd << " exit." << endl;
                        pfd[i] = pfd[nfds - 1];
                        nfds--;
                        break;
                    }
                    else if (pfd[i].revents & POLLIN) // 消息可读
                    {
                        int len = recv(pfd[i].fd, buff, 4096, 0);
                        if (len <= 0)
                        {
                            cout << pfd[i].fd << " exit." << endl;
                            pfd[i] = pfd[nfds - 1];
                            nfds--;
                        }
                        else
                        {
                            buff[len] = 0;
                            cout << "receive message:" << buff << endl;
                        }
                        break;
                    }
                }
            }
        }
    }
    return 0;
}

epoll

epoll是Linux特有的IO复用函数，与前面提到的select和poll在实现上有较大的差异。

epoll使用一组函数来完成任务，而非单个函数
epoll把用户关心的事件放进内核的一个事件表中，不用像select、poll那样每次都要重置,但epoll需要一个额外的文件描述符来标识内核中的事件表

#include <sys/epoll.h>
//创建指向内核事件表的文件描述符，size参数指示需要多大的事件表
int epoll_create(int size);
/*操作epoll的内核事件表
epfd参数: epoll_create返回的内核事件表描述符
fd参数: 要操作的文件描述符
op参数: 指定操作类型
event参数: 指定事件
*/
int epoll_ctl(int epfd,int op,int fd,struct epoll_event*event);

op参数的类型：

EPOLL_CTL_ADD: 往事件表里注册fd上的事件
EPOLL_CTL_MOD: 修改fd上的注册事件
EPOLL_CTL_DEL: 删除fd上的注册事件

event参数类型：

struct epoll_event
{
    __uint32_t events;/*epoll事件*/
    epoll_data_t data;/*用户数据*/
};

epoll支持的事件类型和poll基本相同。表示epoll事件类型的宏是在poll对应的宏前加上“E”，比如epoll的数据可读事件是EPOLLIN。但epoll有两个额外的事件类型——EPOLLET和EPOLLONESHOT。

data用于存储用户数据，其定义如下：

typedef union epoll_data
{
    void* ptr;
    int fd;
    uint32_t u32;
    uint64_t u64;
}epoll_data_t;

epoll_data_t是一个联合体，其4个成员中使用最多的是fd，它指定事件所从属的目标文件描述符。ptr成员可用来指定与fd相关的用户数据。

epoll_ctl成功时返回0，失败则返回-1并设置errno。

epoll系列系统调用的主要接口是epoll_wait函数。它在一段超时时间内等待一组文件描述符上的事件，其原型如下：

#include <sys/epoll.h>
/*
maxevents参数指定最多监听多少个事件，它必须大于0。
timeout参数的含义与poll接口的timeout参数相同。
*/
int epoll_wait(int epfd, struct epoll_event* events, int maxevents, int timeout);

该函数成功时返回就绪的文件描述符的个数，失败时返回-1并设置errno.

epoll_wait函数如果检测到事件，就将所有就绪的事件从内核事件表（由epfd参数指定）中复制到它的第二个参数events指向的数组中。这个数组只用于输出epoll_wait检测到的就绪事件，而不像select和poll的数组参数那样既用于传入用户注册的事件，又用于输出内核检测到的就绪事件。这就极大地提高了应用程序索引就绪文件描述符的效率。

EPOLL 的ET和LT模式

epoll对文件描述符的操作有两种模式：LT（Level Trigger，电平触发）模式和ET（Edge Trigger，边沿触发）模式。当然这是与硬件无关的，只是模拟效果。

默认工作模式是LT，与poll和select一致，这种情况下相当于一个更高效的poll。当epoll_wait检测到其上有事件发生并将此事件通知应用程序后，应用程序可以不立即处理该事件。这样，当应用程序下一次调用epoll_wait时，epoll_wait还会再次向应用程序通告此事件，直到该事件被处理。

采用ET模式，当epoll_wait检测到其上有事件发生并将此事件通知应用程序后，应用程序必须立即处理该事件，因为后续的epoll_wait调用将不再向应用程序通知这一事件。可见，ET模式在很大程度上降低了同一个epoll事件被重复触发的次数，因此效率要比LT模式高。

注：每个使用ET模式的文件描述符都应该是非阻塞的。如果文件描述符是阻塞的，那么读或写操作将会因为没有后续的事件而一直处于阻塞状态。

EPOLLONESHOT事件

EPOLLONESHOT事件实现的是socket连接在任一时刻都只被一个线程处理。处理方式类似于加锁操作。

对于注册了EPOLLONESHOT事件的文件描述符，操作系统最多触发其上注册的一个可读、可写或者异常事件，且只触发一次，除非我们使用epoll_ctl函数重置该文件描述符上注册的EPOLLONESHOT事件。当一个线程在处理某个socket时，其他线程是不可能有机会操作该socket的。同样的，在线程处理完socket后，应该立即重置其EPOLLONESHOT事件，保证下次socket可读时，其EPOLLIN事件能被触发。

示例

#include <bits/stdc++.h>
#include <cstring>
#include <errno.h>
#include <netinet/in.h>
#include <sys/epoll.h>
#include <sys/socket.h>
#include <sys/types.h>

using namespace std;

int main()
{
    int sock = socket(AF_INET, SOCK_STREAM, 0);
    if (sock == -1)
    {
        cout << "创建socket失败：" << strerror(errno) << endl;
        exit(0);
    }
    sockaddr_in addr;
    bzero(&addr, 0);

    addr.sin_family = AF_INET;
    addr.sin_addr.s_addr = htonl(INADDR_ANY); // 自动获取主机ip
    addr.sin_port = htons(8000);

    int ret;

    ret = bind(sock, (struct sockaddr *)&addr, sizeof(addr));
    if (ret == -1)
    {
        cout << "绑定socket失败：" << strerror(errno) << endl;
        exit(0);
    }
    ret = listen(sock, 10);
    if (ret == -1)
    {
        cout << "监听socket失败：" << strerror(errno) << endl;
        exit(0);
    }
    cout << "初始化完成" << endl;
    char buff[4096];
    int epfd = epoll_create(64);
    epoll_event events[64], tmpevent;
    tmpevent.events = EPOLLIN;
    tmpevent.data.fd = sock;
    epoll_ctl(epfd, EPOLL_CTL_ADD, sock, &tmpevent);//添加监听socket可读事件

    while (1)
    {
        int ret = epoll_wait(epfd, events, 64, -1);
        if (ret == -1)
        {
            cout << strerror(errno) << endl;
            exit(0);
        }
        else
        {
            //遍历就绪的事件
            for (int i = 0; i < ret; i++)
            {
                if (events[i].data.fd == sock) //新的连接
                {
                    int clientfd = accept(sock, NULL, 0);
                    tmpevent.events = EPOLLIN | EPOLLRDHUP | EPOLLET | EPOLLONESHOT;
                    tmpevent.data.fd = clientfd;
                    epoll_ctl(epfd, EPOLL_CTL_ADD, clientfd, &tmpevent);
                    cout << "new connect: " << clientfd << endl;
                }
                else
                {
                    //断开连接时会同时触发EPOLLRDHUP和EPOLLIN，因此先判断EPOLLRDHUP
                    if (events[i].events & EPOLLRDHUP)
                    {
                        cout << events[i].data.fd << " exit" << endl;
                        close(events[i].data.fd);
                        epoll_ctl(epfd, EPOLL_CTL_DEL, events[i].data.fd, NULL);
                    }
                    else if (events[i].events & EPOLLIN)
                    {
                        while (1)
                        {
                            int len = recv(events[i].data.fd, buff, 4096, MSG_DONTWAIT);
                            if (len <= 0) break;
                            buff[len] = 0;
                            cout << "receive message:" << buff << endl;
                        }
                        //EPOLLONESHOT模式下处理完后必须重置，否则下次不能触发
                        tmpevent.events = EPOLLIN | EPOLLRDHUP | EPOLLET | EPOLLONESHOT;
                        tmpevent.data.fd = events[i].data.fd;
                        epoll_ctl(epfd, EPOLL_CTL_MOD, events[i].data.fd, &tmpevent);
                    }
                }
            }
        }
    }
    return 0;
}

应用：非阻塞connect

将socket设置成非阻塞：

int setnonblocking(int fd)
{
    int old_option = fcntl(fd, F_GETFL);//获取文件状态标记
    int new_option = old_option | O_NONBLOCK;//加上非阻塞状态
    fcntl(fd, F_SETFL, new_option);//设置文件状态标记
    return old_option;
}

使用非阻塞的socket进行connect操作时，如果连接没有立即建立，会返回EINPROGRESS的错误。在这种情况下，我们可以调用select、poll等函数来监听这个连接失败的socket上的可写事件。当select、poll等函数返回后，再利用getsockopt来读取错误码并清除该socket上的错误。如果错误码是0，表示连接成功建立，否则连接失败。

使用非阻塞的socket可以同时对多个socket进行connect操作，然后对没有立即建立连接的socket使用select、poll等函数来监听，提高连接的效率。

不过，该方法仍存在某些移植性问题，比如connect始终失败，select对EINPROGRESS状态下的socket可能不起作用，以及某些版本的getsockopt出现的返回值并不相同。