网络编程:阻塞、非阻塞、同步、异步的区分
一、阻塞、非阻塞、同步、异步概述
在网络编程的过程中,我们操作一次I/O的时候,其实通常都会经历两个不同的阶段:
1. 数据的准备阶段
2. 数据的读写阶段
通常,在数据的准备阶段我们会选择当前的I/O操作是阻塞的还是非阻塞的;而在数据的读写阶段,我们会选择当前的当前的I/O操作是同步的还是异步的。这就是四者在全局上的一个综合关系。
二、阻塞
在进行网络编程的过程中,我们使用默认的文件描述符状态的话其实一般都是阻塞的。比如我们想用recv函数
来接收网络通信中的另一方发送过来的消息。要注意,发送过来的消息一般是在内核的一段缓存中,而不是发送给用户态的用户。
如果在这段内核的缓存中没有消息,那recv函数
就会阻塞在这个函数的调用处直到有信息到内核的缓存中
。那么,这个过程就是阻塞。
三、非阻塞
和阻塞相反,如果用setsockopt
(详见:web服务器开发需要用到的sock函数)把文件描述符设置成非阻塞的。那么在调用recv函数
时在内核的一段缓存
中虽然没有数据,但也会立即返回-1 并设置errno为EAGAIN 或者 EWOULDBLOCK。
那么,在这种模式下,通常会要求我们写一个while循环,一次又一次的询问有没有数据。
四、同步
同步和异步的区别,其实是发生是数据准备好之后的数据读写阶段。还是拿recv
函数举例,在内核空间的一段缓存中接收到了数据之后,需要把这些数据搬到用户实现定义好的、属于用户的缓存空间中。
区分同步异步的关键就是“数据究竟是谁来搬的?”如果是同步的话,数据就是用户自己来搬这些数据,换句话来说,搬数据的时间是算在用户的程序头上的
。
五、异步
在上面已经阐述得很清楚了,如果数据是内核搬的,搬运数据的时间算在内核身上,那就是异步。
那么,异步这么好,能节省用户搬运数据的时间,为什么不全部用异步的模式呢?
原因就是异步的I/O编程起来比较复杂。相比于同步,异步的编程在实现的时候需要和内核约定好一个信号,这个信号是内核用来通知用户程序:我已经收到了数据(数据准备阶段),而且把数据搬到你指定的缓存空间了,现在你可以来取数据了。