网络编程中阻塞与非阻塞，同步与异步、I/O模型的理解

最新推荐文章于 2022-03-30 10:54:40 发布

赵同学

最新推荐文章于 2022-03-30 10:54:40 发布

阅读量663

点赞数 2

分类专栏：转载文章标签：网络编程异步 io

转载专栏收录该内容

4 篇文章 0 订阅

订阅专栏

一、概念理解

在进行网络编程时，我们常常见到同步(Sync)、异步(Async)，阻塞(Block)、非阻塞(Unblock)四种调用方式：
同步：
所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回。也就是必须一件一件事做,等前一件做完了才能做下一件事。
异步：
异步的概念和同步相对。当一个异步过程调用发出后，调用者不能立刻得到结果。实际处理这个调用的部件在完成后，通过状态、通知和回调来通知调用者。
阻塞：
阻塞调用是指调用结果返回之前，当前线程会被挂起（线程进入非可执行状态，在这个状态下，cpu不会给线程分配时间片，即线程暂停运行）。函数只有在得到结果之后才会返回。
有人也许会把阻塞调用和同步调用等同起来，实际上它们是不同的。对于同步调用来说，很多时候当前线程还是激活的，只是从逻辑上当前函数没有返回而已。例如，我们在socket中调用recv函数，如果缓冲区中没有数据，这个函数就会一直等待，直到有数据才返回。而此时，当前线程还会继续处理各种各样的消息。
非阻塞：

非阻塞和阻塞的概念相对应，指在不能立刻得到结果之前，该函数不会阻塞当前线程，而会立刻返回。

进程（线程）的阻塞模式和阻塞函数调用：

进程（线程）是否处于阻塞模式和函数是不是阻塞调用者进程（线程）有很强的相关性，但是并不是一一对应的。在阻塞模式的进程（线程）上可以有非阻塞的调用方式，我们可以通过一定的API去轮询状态，在适当的时候调用阻塞函数，就可以避免阻塞（这种情况下面的非阻塞IO模式会讲到）。而对于非阻塞对象，调用特殊的函数也可以进入阻塞调用，函数select就是这样的一个例子。

总结如下：

（1）同步，就是 我调用一个功能，该功能没有结束前，我死等结果。
（2）异步，就是 我调用一个功能，不需要知道该功能结果，该功能有结果后通知我（回调通知）；【调用后，我就不管了，我去做我的事，有结果会自动通知我(回调)】
（3）阻塞，就是 调用我（函数），我（函数）没有接收完数据或者没有得到结果之前，我（函数）不会返回。
（4）非阻塞，就是 调用我（函数），我（函数）立即返回，通过select通知调用者
同步IO和异步IO的区别就在于： 数据拷贝的时候进程是否阻塞！
阻塞IO和非阻塞IO的区别就在于：应用程序的调用是否立即返回！
注：上面的总结中，一定要体会同步/异步中 我调用，和阻塞/非阻塞中 调用我的却别。对于 我调用，指的是 如果我（应用进程/线程）调用一个功能，该功能可能是同步的也可能是异步的，如果是同步，则 我（应用进程/线程）一直等待该功能返回后我才继续往下执行，而如果是异步，则我（应用进程/线程）调用后可以直接返回，不用等到该功能返回，但同时我也不能获得这个异步功能结果，所以只好等到该功能完成之后（数据以及准备好）通过其他方式（回调函数）来进行数据处理；而对于 调用我，是 指应用进程调用我（这里的我大多数是一个函数），而我的实现可能是阻塞模式，也可能是非阻塞模式，如果是阻塞模式，则我会阻塞调用者进程（线程），即调用者进程（线程）现在是挂起的状态，调用者进程（线程）直到我返回之后才会被唤醒重新继续往下执行。如果是非阻塞模式，则调用者进程（线程）在调用我的时候，我会立即返回，从而不会造成调用者进程（线程）的阻塞。

对于举个简单c/s （客户端/服务器）模式：
同步：提交请求->等待服务器处理->处理完毕返回这个期间客户端浏览器不能干任何事
异步：请求通过事件触发->服务器处理（这是浏览器仍然可以作其他事情）->处理完毕
阻塞和非阻塞是指当进程访问的数据如果尚未就绪,进程是否需要等待,简单说这相当于函数内部的实现区别,也就是未就绪时是直接返回还是等待就绪;

而同步和异步是指访问数据的机制,同步一般指主动请求并等待I/O操作完毕的方式,当数据就绪后在读写的时候必须阻塞(区别就绪与读写二个阶段,同步的读写必须阻塞),异步则指主动请求数据后便可以继续处理其它任务,随后等待I/O,操作完毕的通知,这可以使进程在数据读写时也不阻塞。(等待"通知")

二、 Linux下的五种I/O模型

阻塞I/O（blocking I/O）、非阻塞I/O （nonblocking I/O）、I/O复用(select 和poll) （I/O multiplexing）、信号驱动I/O （signal driven I/O (SIGIO)）、异步I/O （asynchronous I/O (the POSIX aio_functions)）。其中前四种都是同步，只有最后一种才是异步IO。

（1）阻塞I/O模型

该模式下进程会一直阻塞，直到数据拷贝完成应用程序调用一个IO函数，导致应用程序阻塞，等待数据准备好。如果数据没有准备好，一直等待….数据准备好了，从内核拷贝到用户空间,IO函数返回成功指示。

阻塞I/O模型图：在调用recv()/recvfrom（）函数时，发生在内核中等待数据和复制数据的过程。

当调用recv()函数时，系统首先查是否有准备好的数据。如果数据没有准备好，那么系统就处于等待状态。当数据准备好后，将数据从系统缓冲区复制到用户空间，然后该函数返回。在套接应用程序中，当调用recv()函数时，未必用户空间就已经存在数据，那么此时recv()函数就会处于等待状态。
并不是所有Windows Sockets API以阻塞套接字为参数调用都会发生阻塞。例如，以阻塞模式的套接字为参数调用bind()、listen()函数时，函数会立即返回。
　使用阻塞模式的套接字，开发网络程序比较简单，容易实现。当希望能够立即发送和接收数据，且处理的套接字数量比较少的情况下，使用阻塞模式来开发网络程序比较合适。

阻塞模式套接字的不足表现为，在大量建立好的套接字线程之间进行通信时比较困难。当使用“生产者-消费者”模型开发网络程序时，为每个套接字都分别分配一个读线程、一个处理数据线程和一个用于同步的事件，那么这样无疑加大系统的开销。其最大的缺点是当希望同时处理大量套接字时，将无从下手，其扩展性很差

（2）非阻塞IO模型

非阻塞IO通过进程反复调用IO函数（多次系统调用，并马上返回）；在数据拷贝的过程中，进程是阻塞的；

我们把一个SOCKET接口设置为非阻塞就是告诉内核，当所请求的I/O操作无法完成时，不要将进程睡眠，而是返回一个错误。这样我们的I/O操作函数将不断的测试数据是否已经准备好，如果没有准备好，继续测试，直到数据准备好为止。在这个不断测试的过程中，会大量的占用CPU的时间。
把SOCKET设置为非阻塞模式，即通知系统内核：在调用Windows Sockets API时，不要让线程睡眠，而应该让函数立即返回。在返回时，该函数返回一个错误代码。图所示，一个非阻塞模式套接字多次调用recv()函数的过程。前三次调用recv()函数时，内核数据还没有准备好。因此，该函数立即返回WSAEWOULDBLOCK错误代码。第四次调用recv()函数时，数据已经准备好，被复制到应用程序的缓冲区中，recv()函数返回成功指示，应用程序开始处理数据。

（3）IO复用模型
主要是select和epoll；对一个IO端口，两次调用，两次返回，比阻塞IO并没有什么优越性；关键是能实现同时对多个IO端口进行监听；
I/O复用模型会用到select、poll、epoll函数，这几个函数也会使进程阻塞，但是和阻塞I/O所不同的的，这两个函数可以同时阻塞多个I/O操作。而且可以同时对多个读操作，多个写操作的I/O函数进行检测，直到有数据可读或可写时，才真正调用I/O操作函数。