Unix网络编程的五种IO模型:阻塞IO、非阻塞IO、多路复用IO、信号驱动IO以及异步IO。
操作系统的IO模型是底层基石,Java有三种IO模型的基础:NIO、NIO、AIO就是对于IO的操作其实就是进一步的封装。
Java的三种IO模型,BIO就是操作系统提供的阻塞IO模型,NIO是IO复用模型,而AIO是异步IO模型
不管是网络IO还是磁盘IO,对于读操作而言,都是等到网络的某个数据分组到达后/数据准备好后,将数据拷贝到内核空间的缓冲区中,再从内核空间拷贝到用户空间的缓冲区。
涉及相关概念
(1)用户空间 / 内核空间
为了保证用户进程不能直接操作内核(kernel)(随意修改内核可以直接黑掉计算机),保证内核的安全,操作系统将虚拟空间划分为两部分,一部分为内核空间,一部分为用户空间。【内核空间与用户空间的有自己的通信方式】
(2)文件描述符
计算机科学中的一个术语,它是一个文件索引值(非负整数)。这一概念只适用于UNIX、Linux这样的操作系统。
该索引指向内核为每一个进程所维护的 该进程打开文件的记录表
(3)系统调用函数(重要)
-
select select系统调用允许程序同时在多个底层文件描述符上,等待输入的到达或输出的完成。以数组形式存储文件描述符,64位机器默认2048个。当有数据准备好时,无法感知具体是哪个流OK了,所以需要一个一个的遍历,函数的时间复杂度为O(n)。
-
poll 以链表形式存储文件描述符,没有长度限制。本质与select相同,也无法感知具体是哪个流OK了,所以需要一个一个的遍历,函数的时间复杂度为O(n)。
-
epoll 以红黑树形式存储文件描述符,是基于事件驱动的,如果某个流准备好了,会以事件通知,知道具体是哪个流,因此不需要遍历,函数的时间复杂度为O(1)。
Unix网络编程的五种IO模型
1、阻塞IO模型
阻塞IO的执行过程是进程进行系统调用,等待内核将数据准备好并复制到用户态缓冲区后,进程放弃使用CPU并一直阻塞在此,直到数据准备好。
2、非阻塞IO模型
等待数据阶段:未阻塞, 用户进程需要盲等,不停的去轮询内核。 数据复制阶段:阻塞,此时进行数据复制。
3、IO多路复用模型
相比于阻塞IO模型,多路复用只是多了一个select/poll/epoll函数。select函数会不断地轮询自己所负责的文件描述符/套接字的到达状态,当某个套接字就绪时,就对这个套接字进行处理。select负责轮询等待,recvfrom负责拷贝。当用户进程调用该select,select会监听所有注册好的IO,如果所有IO都没注册好,调用进程就阻塞。
4、信号驱动IO模型
数据准备阶段:未阻塞,当数据准备完成之后,会主动的通知用户进程数据已经准备完成,对用户进程做一个回调。 数据拷贝阶段:阻塞用户进程,等待数据拷贝。
5、异步IO模型
异步I/O执行的两个阶段都不会阻塞读写操作,由内核完成。 完成后内核将数据放到指定的缓冲区,通知应用程序来取。