阻塞、非阻塞和异步、同步
1.同步与异步
同步与异步关注的是消息机制,所谓的同步,就是在发出一个调用时,在没有得到结果之前,该调用就不会返回。但是一旦调用返回,就得到该返回值。换句话说就是由调用者主动等待这个调用的结果。
异步:调用在发出之后,这个调用就直接返回了,所以没有返回结果。换句话说,当一个异步过程调用发出后,调用者不会立刻可得到结果。而是在“调用”发出之后,被调用者通过状态、通知来通知调用者,或通过回调函数处理这个调用。
举个通俗的例子:
你打电话问书店老板有没有《分布式系统》这本书,如果是同步通信机制,书店老板会说,你稍等,”我查一下”,然后开始查啊查,等查好了(可能是5秒,也可能是一天)告诉你结果(返回结果)。
而异步通信机制,书店老板直接告诉你我查一下啊,查好了打电话给你,然后直接挂电话了(不返回结果)。然后查好了,他会主动打电话给你。在这里老板通过“回电”这种方式来回调。
- 阻塞与非阻塞
阻塞和非阻塞关注的是程序在等待调用结果(消息,返回值)时的状态.
阻塞调用是指调用结果返回之前,当前线程会被挂起。调用线程只有在得到结果之后才会返回。
非阻塞调用指在不能立刻得到结果之前,该调用不会阻塞当前线程。
还是上面的例子,
你打电话问书店老板有没有《分布式系统》这本书,你如果是阻塞式调用,你会一直把自己“挂起”,直到得到这本书有没有的结果,如果是非阻塞式调用,你不管老板有没有告诉你,你自己先一边去玩了, 当然你也要偶尔过几分钟check一下老板有没有返回结果。
在这里阻塞与非阻塞与是否同步异步无关。跟老板通过什么方式回答你结果无关。
对unix来讲,阻塞I式I/O(默认),非阻塞I式I/O(nonblock),I/O复用(select/poll/epoll)都属于同步I/O;因为它们在数据由内核空间复制回进程缓冲区时都是阻塞的。只有异步I/O(AIO)模型是符合异步I/O操作的含义的,即在1数据准备完成、2由内核空间拷贝回缓冲区后通知进程,在等待通知的这段时间里可以干别的事。
I/O复用模型:
主要是select和epoll;对一个IO端口,进行两次调用,两次返回,比阻塞IO并没有什么优越性;关键是能实现同时对多个IO端口进行监听。
信号驱动IO:
简介: 二次调用,二次返回。
首先我们允许套接口进行信号驱动I/O,并安装一个信号处理函数,进程继续运行并不阻塞I。当数据准备好时,进程会收到一个SIGIO信号,可以在信号处理函数中调用I/O操作函数处理数据。
异步IO模型:
简介:数据拷贝的时候进程无需阻塞。
当一个异步调用发出后,调用者不能立刻得到结果。实际处理这个调用的部件在完成后,通过状态、通知和回调来通知调用者的输入输出操作。
同步IO引起进程阻塞I,直到IO操作完成。
异步IO不会引起进程阻塞。
IO复用是先通过select来调用阻塞。
Epoll和select都能提供多路I/O复用的解决方案。Epoll是linux特有的,select是POSIX所规定的。
Select:
Seclect本质上是通过设置或检查存放fd标志位的数据结构来进行下一步处理。这样所带来的缺点:
1. 单个进程乐意监视的fd数量被限制,即能监听端口的大小有限。
一般来说这个数目和系统内存的关系很大,具体数目可以cat/proc/sys/fs/file-max察看。
2. 对socket进行扫描时是线性扫描,即采用轮询的方法,效率较低。
3. 需要维护一个用来存放大量fd的数据结构,这样使得用户空间和内核空间在传递该结构时复制开销大。
Poll:
Poll本质上和select没有区别,它将用户传入的数据拷贝到内核空间,然后查询每个fd对应的设备状态,如果设备就绪则再设备等待队列中加入一项并继续遍历,如果遍历完所有fd后没有发现就绪设备,则挂起当前进程,直到就绪或者主动超时,被唤醒后它又要再次遍历fd.这个过程经历了多次无谓的遍历。
它没有最大连接数的限制,原因是它是基于链表来存储的,但是同样有一个缺点:
1. 大量的fd的数组被整体复制于用户态和内核地址空间之间,而不管这样的复制是不是有意义。
“水平触发”,如果报告了fd之后,没有被处理,那么下次poll时会再次报告该fd。
Epoll:
Epoll支持水平触发和边缘触发,最大特点在于边缘触发,它只告诉进程哪些fd刚刚变为就绪态,并且只会通知一次。还有一个特点是,epoll使用“事件”的就绪通知方式,通过epoll_ctl注册fd,一旦该fd就绪,内核就会采用类似callback的回调机制来激活该fd,epoll_wait便可以通知。
即epoll最大有点就在于它只管你“活跃”的连接,而跟连接总数无关,因此在实际的网络环境中,epoll的效率就会远远高于select和poll.
epoll的优点:
1、没有最大并发连接的限制,能打开的FD的上限远大于1024(1G的内存上能监听约10万个端口);
2、效率提升,不是轮询的方式,不会随着FD数目的增加效率下降。只有活跃可用的FD才会调用callback函数;
即Epoll最大的优点就在于它只管你“活跃”的连接,而跟连接总数无关,因此在实际的网络环境中,Epoll的效率就会远远高于select和poll。
3、 内存拷贝,利用mmap()文件映射内存加速与内核空间的消息传递;即epoll使用mmap减少复制开销。