主要学习的这篇文章:《IO - 同步,异步,阻塞,非阻塞(亡羊补牢篇)》
以下均是自己的理解
同步(synchronous) IO和异步(asynchronous) IO,阻塞(blocking) IO和非阻塞(non-blocking)IO分别是什么,到底有什么区别。
Stevens在文章中一共比较了五种IO Model:
blocking IO
nonblocking IO
IO multiplexing
signal driven IO
asynchronous IO
由于signal driven IO在实际中并不常用,所以我这只提及剩下的四种IO Model。
一个io操作(比如read)的具体实现会分成两步:1.等待数据就绪。2.内核复制数据到用户内存。
阻塞IO就是一般的read/write,如果第一步数据没有数据,就会阻塞在那里等待数据就绪,一直到数据就绪并完成第二步才返回,效率是最高的,会阻塞死进程。
非阻塞IO就是设置O_NOBLOCK设置的read,如果第一步数据没有就绪会立马返回一个错误,如果第一步数据已经就绪就会接着执行第二步然后返回;所以如果想读到数据,
就需要多次的操作,效率不及阻塞的。
IO multiplexing 就是select,epoll,会阻塞查询第一步,直到数据就绪返回通知用户,然后用户再调用read/write操作。select的优势在于可以监视处理多个io操作。
阻塞并不等于同步,非阻塞也不同于异步。
阻塞与非阻塞就是体现在用户进程是否会“立即”返回,一般看来重点体现在第一步,但是第二步就是内核复制数据到用户内存空间这个耗时往往被人忽略,数据量庞大
的时候这里就会明显的显示出来,就是说第二步一定是一个阻塞的一步,执行第二步肯定会阻塞用户进程,只是时间以数据量的大小而定,这里就是重点体现同步和异步
的地方。一般情况下我们没有特意的声明使用异步操作,那么这次IO操作就会是同步操作了。以此看来不管是阻塞还是非阻塞IO都会阻塞用户进程,只是阻塞的地方不同
。
异步操作需要特殊设置先,然后就是aio_read的时候会立即返回,随后用户进程就去做自己的事情,当内核处理完毕第一和第二步之后会发送信号通知用户进程,此过程
中完全不会阻塞用户进程。
根据以上得出一个结论:同步一定会阻塞进程,异步绝对不会阻塞进程。但是谨记一点:非阻塞IO是会阻塞进程的,阻塞在第二步。并且一个完整的IO操作应该是从用户进
程开始直到用户读取到数据为止。