前言
网络IO会涉及到两个系统对象
- 用户空间调用IO的进程或线程
- 内核空间的内核系统
比如发生IO read时,会经历两个阶段,一个是等待数据准备就绪,另一个是将数据从内核拷贝到进程或线程中。因为在这两个阶段上有不同的情况,所以出现了多种网络IO模型
阻塞IO(blocking IO)
在linux中,默认情况下所有socket都是blocking的,如下图:
当用户进程调用read时,Kernel就进行第一阶段:准备数据。对于网络IO来说,很多时候数据包都没有到达,这个时候内核在等足够的数据到来。那么在用户进程这边,整个进程就被阻塞,当内核将数据准备好了,就会将数据从内核拷贝到用户内存,然后根据内核返回的结果,用户进程才会解除block状态,继续运行。
总而言之,blocking IO就是在IO执行的两个阶段都阻塞。
非阻塞IO
Linux下,可以通过设置socket使其变为non-blocking。当对一个non-blocking socket进行操作时,流程如下:
可以看出,非阻塞IO中,用户进程需要不断轮训kernel数据是否准备好了。
在非阻塞下,用recv接收数据,recv接口在调用后立即返回,返回值代表了不同含义
- recv() 返回值 > 0,表示数据接收完毕,返回值是接收到的字节数
- recv() 返回值 == 0,表示连接已经正常断开;
- recv() 返回值 == -1,且errno等于EAGAIN,表示recv操作还未执行完成。
- recv() 返回值 == -1,且errno不等于EAGAIN,表示recv遇到系统错误,具体需要看errno。
非阻塞的接口和阻塞的接口一个显著差别在于在被调用后是否立即返回。我们可以用fcntl来设置fd为非阻塞状态。