五种IO模型:
一.在总结五种IO模型之前我们了解一下什么是IO???
I表示input,O表示output,合在一起就是IO—表示输入输出设备;每个设备都有一个专用的IO地址,用来处理自己的输入输出信息;
需要注意:IO地址绝对不能有重复,如果两个IO地址有冲突则会造成系统硬件不能正常工作;
二. IO模型:
对于一次IO访问(以read举例),数据会先被拷贝到操作系统内核的缓冲区中,
然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。
所以说,当一个read操作发生时,它会经历两个阶段:
(1) 等待数据准备
(2)将数据从内核拷贝到进程中
在网络编程环境中,一次IO操作主要包括两个部分:
- 等数据准备
- 拷贝数据
所以如果想要提高IO效率,就应该想办法让等的比重减少。
Linux下常见五种IO模型分类:
三.五种IO模型及基本概念:
1.阻塞IO:
在内核将数据准备好之前, 系统调用会一直等,所有的套接字, 默认都是阻塞方式;
具体的过程:
(1)当用户进程调用了recvfrom这个系统调用,kernel就开始了IO的第一个阶段:
准备数据(对于网络IO来说,很多时候数据在一开始还没有到达;比如,还没有收到一个完整的UDP包。这个时候kernel就要等待足够的数据到来);这个过程需要等待,也就是说数据被拷贝到操作系统内核的缓冲区中是需要一个过程的;而在用户进程这边,整个进程会被阻塞(当然,是进程自己选择的阻塞)。
(2)当kernel一直等到数据准备好了,它就会将数据从kernel中拷贝到用户内存;然后kernel返回结果,用户进程才解除block的状态,重新运行起来。
2.非阻塞IO:
如果内核还未将数据准备好, 系统调用仍然会直接返回, 并且返回EWOULDBLOCK错误码
注意:非阻塞IO往往需要程序员循环的方式反复尝试读写文件描述符,这个过程称为轮询。这对CPU来说是较大的浪费,一 般只有特定场景下才使用;
什么是轮循??====>非阻塞IO往往需要程序员用循环的方式去反复尝试读写文件描述符这个过程就是轮询;
具体流程:
(1)当用户进程发出read操作时,如果kernel中的数据还没有准备好, 那么它并不会block用户进程,而是立刻返回一个error。
(2)从用户进程角度讲 ,它发起一个read操作后,并不需要等待,而是马上就得到了一个结果用户进程判断结果是一个error时,它就知道数据还没有准备好,于是它可以再次发送read操作(这个反复尝试读写文件描述符的过程称为轮询)。
(3)一旦kernel中的数据准备好了,并且又再次收到了用户进程的system call,那么它马上就将数据拷贝到了用户内存,然后返回。
3.信号驱动IO:
内核将数据准备好的时候, 使用SIGIO信号通知应用程序进行IO操作
具体流程如下:
(1)首先开启套接口信号驱动I/O功能,并通过系统调用sigaction执行一个信号处理函数(此系统调用立即返回,进程继续工作,它是非阻塞的)。
(2)当数据准备就绪时,就为该进程生成一个SIGIO信号,通过信号回调通知应用程序调recvfrom来读取数据,并通知主循环函数处理数据。
4.异步IO:
由内核在数据拷贝完成时, 通知应用程序(而信号驱动是告诉应用程序何时可以开始拷贝数据)
具体流程如下:
(1)用户进程发起read操作之后,立刻就可以开始去做其它的事。
(2)而另一方面,从kernel的角度,当它受到一个asynchronous read之后,首先它会立刻返回,所以不会对用户进程产生任何block。
(3)然后,kernel会等待数据准备完成,然后将数据拷贝到用户内存,当这一切都完成之后,kernel会给用户进程发送一个signal,告诉它read操作完成了。
5.IO多路转接:
IO复用的好处是我们可以通过(select/poll/epoll)一个时刻处理多个文件描述符;即同一个线程内同时处理多个TCP连接;
(最大优势是减少系统开销,不必过多创建或维护线程)
四.高级IO:
1.同步与异步的概念及区别:
(1)同步: 在发出一个调用时候,在没有得到结果之前,该调用就不返回,但是一旦调用返回就得到返回值;换句话说,就是有调用栈主动等待这个调用的结果
(2)异步:调用在发出之后,这个调用就直接返回了,所以没有返回结果,换句话说就是当一个异步过程调用发出之后,调用者不会立刻得到结果,而是在调用发出之后,被调用者通过状态,通知调用者,或者通过回调函数处理这个调用
两者之间的区别:功能是不是自己来完成;
2.阻塞和非阻塞的概念及区别:
(1)阻塞调用:调用结果返回之前当前线程会被挂起,调用线程只有在得到结果之后才会被返回;
(2)非阻塞调用:指在不能立刻得到结果之前,该调用不会阻塞当前线程;
两者之间的区别:调用函数的时候条件不满足的时候是否会停止该线程的运行。
举个栗子:将一个文件描述符设置成非阻塞IO;
一个文件描述符默认都是阻塞IO,可以使用fcntl()函数设置成非阻塞IO。
#include <unistd.h>
#include <fcntl.h>
int fcntl(int fd, int cmd, ... /* arg */ );
根据我们传递的cmd的值不同,后面的参数也不相同,fcntl函数有五种功能:
- 赋值一个现有的文件描述符(cmd=F_DUPFD)
- 获得/设置文件描述符标记(cmd=F_GETFD或者F_SETFD)
- 获得/设置一个文件状态标记(cmd=F_GETFL或者F_SETFL)
- 获得/设置异步IO所有权(cmd=F_GETOWN或者F_SETOWN)
- 或者/设置记录锁(cmd=F_GETLK或者F_SETLKW)
将一个文件描述符设置成非阻塞只需要三行代码:
int f1 = fcntl(fd,F_GETFL);
f1 = f1 | O_NONBLOCK;
fcntl(fd,F_SETFL,f1);