理论:
网络IO涉及两系统对象:1、用户空间调用io的进程或线程;
2、内核空间的系统调用;
有两个阶段:1、等待数据准备就绪;
2、将数据从内核拷贝到进程或线程中;
io模型的演进:
1、阻塞IO(blocking IO)
特点:在IO执行的两个阶段都会block.
2、非阻塞IO(non-blocking IO)
在非阻塞状态下,recv()在被调用后立即返回。可以使用fcntl(fd, F_SETFL, O_NONBLOCK);将句柄fd设为非阻塞状态。此时服务器可通过循环调用recv(),在单进程内实现对所有链接的数据接收工作。但该方案会大幅提高CPU的占用率。
3、多路复用IO(IO multiplexing)
使用了两个系统调用(select和read),最大优势是使用了select后可以在一个线程内同时处理多个socket的IO请求。 而同步阻塞模型中,必须要多线程才能达到该效果。一般将每个socket设置为non-blocking,但整个用户进程一直都是被select block了,而不是soket IO block。
涉及接口原型:
FD_ZERO(int fd, fd_set* fds);
FD_SET(int fd, fd_set* fds);
FD_ISSET(int fd, fd_set* fds);
FD_CLR(int fd, fd_set* fds);
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
***客户端的一个connect()操作会在服务端激发一个“可读事件”,因此可用select()探测connect行为。动态维护select()中的readfds,writefds和exceptfds这三个参数最为关键。
4、异步IO(Asynchronous IO)
Linux 2.6才引入
该类模型不会对用户进程产生任何block,是真正的非阻塞,用户进程发起IO操作后,就不用管了,指定kernel发送一个信号,告诉进程 IO已经完成。
5、信号驱动IO(signal driven IO, SIGIO)
需要允许套接字进行信号驱动IO,并安装一个信号处理函数,进程继续运行不阻塞。当数据就绪后,信号处理函数回调read读取数据,也可以通知主循环读取数据。优点:等待数据到达的第一阶段用户进程不用等待,可以继续执行。
non-blocking IO和asynchronous IO区别:non-blocking还是要求用户进程主动check,还需要调用recvfrom拷贝数据到用户内存。asynchronous IO将用户进程的整个IO交给了kernel,等做完后的通知。
本专栏知识点是通过<零声教育>的线上课学习,进行梳理总结写下文章,对c/c++linux课程感兴趣的读者,可以点击链接,详细查看课程的服务: