网络编程中阻塞与非阻塞,同步与异步、I/O模型的理解

一、概念理解

     在进行网络编程时,我们常常见到同步(Sync)、异步(Async),阻塞(Block)、非阻塞(Unblock)四种调用方式:
同步:
      所谓同步,就是在发出一个功能调用时,在没有得到结果之前,该调用就不返回。也就是必须一件一件事做,等前一件做完了才能做下一件事。
异步:
      异步的概念和同步相对。当一个异步过程调用发出后,调用者不能立刻得到结果。实际处理这个调用的部件在完成后,通过状态、通知和回调来通知调用者。
阻塞:
     阻塞调用是指调用结果返回之前,当前线程会被挂起(线程进入非可执行状态,在这个状态下,cpu不会给线程分配时间片,即线程暂停运行)。函数只有在得到结果之后才会返回。
     有人也许会把阻塞调用和同步调用等同起来,实际上它们是不同的。对于同步调用来说,很多时候当前线程还是激活的,只是从逻辑上当前函数没有返回而已。 例如,我们在socket中调用recv函数,如果缓冲区中没有数据,这个函数就会一直等待,直到有数据才返回。而此时,当前线程还会继续处理各种各样的消息。
非阻塞:

      非阻塞和阻塞的概念相对应,指在不能立刻得到结果之前,该函数不会阻塞当前线程,而会立刻返回。

进程(线程)的阻塞模式和阻塞函数调用:

     进程(线程)是否处于阻塞模式和函数是不是阻塞调用者进程(线程)有很强的相关性,但是并不是一一对应的。在阻塞模式的进程(线程)上可以有非阻塞的调用方式,我们可以通过一定的API去轮询状 态,在适当的时候调用阻塞函数,就可以避免阻塞(这种情况下面的非阻塞IO模式会讲到)。而对于非阻塞对象,调用特殊的函数也可以进入阻塞调用,函数select就是这样的一个例子。

总结如下:

    (1)同步,就是 我调用一个功能,该功能没有结束前,我死等结果。
    (2)异步,就是 我调用一个功能,不需要知道该功能结果,该功能有结果后通知我(回调通知);【调用后,我就不管了,我去做我的事,有结果   会自动通知我(回调)】
    (3)阻塞,就是 调用我(函数),我(函数)没有接收完数据或者没有得到结果之前,我(函数)不会返回。
    (4)非阻塞,就是 调用我(函数),我(函数)立即返回,通过select通知调用者
同步IO和异步IO的区别就在于: 数据拷贝的时候进程是否阻塞!
阻塞IO和非阻塞IO的区别就在于: 应用程序的调用是否立即返回!
注:
上面的总结中,一定要体会同步/异步中 我调用,和阻塞/非阻塞中 调用我的却别。对于 我调用,指的是 如果我(应用进程/线程)调用一个功能,该功能可能是同步的也可能是异步的,如果是同步,则 我(应用进程/线程)一直等待该功能返回后我才继续往下执行,而如果是异步,则我(应用进程/线程)调用后可以直接返回,不用等到该功能返回,但同时我也不能获得这个异步功能结果,所以只好等到该功能完成之后(数据以及准备好)通过其他方式(回调函数)来进行数据处理;而对于 调用我,是 指应用进程调用我(这里的我大多数是一个函数),而我的实现可能是阻塞模式,也可能是非阻塞模式,如果是阻塞模式,则我会阻塞调用者进程(线程),即调用者进程(线程)现在是挂起的状态,调用者进程(线程)直到我返回之后才会被唤醒重新继续往下执行。如果是非阻塞模式,则调用者进程(线程)在调用我的时候,我会立即返回,从而不会造成调用者进程(线程)的阻塞。

对于举个简单c/s (客户端/服务器)模式:
    同步:提交请求->等待服务器处理->处理完毕返回这个期间客户端浏览器不能干任何事
    异步:请求通过事件触发->服务器处理(这是浏览器仍然可以作其他事情)->处理完毕
    阻塞和非阻塞是指当进程访问的数据如果尚未就绪,进程是否需要等待,简单说这相当于函数内部的实现区别,也就是未就绪时是直接返回还是等待就绪;

而同步和异步是指访问数据的机制,同步一般指主动请求并等待I/O操作完毕的方式,当数据就绪后在读写的时候必须阻塞(区别就绪与读写二个阶段,同步的读写必须阻塞),异步则指主动请求数据后便可以继续处理其它任务,随后等待I/O,操作完毕的通知,这可以使进程在数据读写时也不阻塞。(等待"通知")


二、 Linux下的五种I/O模型

    阻塞I/O(blocking I/O)、非阻塞I/O (nonblocking I/O)、I/O复用(select 和poll) (I/O multiplexing)、信号驱动I/O (signal driven I/O (SIGIO))、异步I/O (asynchronous I/O (the POSIX aio_functions))。其中前四种都是同步,只有最后一种才是异步IO。


(1)阻塞I/O模型

    该模式下进程会一直阻塞,直到数据拷贝完成应用程序调用一个IO函数,导致应用程序阻塞,等待数据准备好。 如果数据没有准备好,一直等待….数据准备好了,从内核拷贝到用户空间,IO函数返回成功指示。

阻塞I/O模型图:在调用recv()/recvfrom()函数时,发生在内核中等待数据和复制数据的过程。


    当调用recv()函数时,系统首先查是否有准备好的数据。如果数据没有准备好,那么系统就处于等待状态。当数据准备好后,将数据从系统缓冲区复制到用户空间,然后该函数返回。在套接应用程序中,当调用recv()函数时,未必用户空间就已经存在数据,那么此时recv()函数就会处于等待状态。
    并不是所有Windows Sockets API以阻塞套接字为参数调用都会发生阻塞。例如,以阻塞模式的套接字为参数调用bind()、listen()函数时,函数会立即返回。
 使用阻塞模式的套接字,开发网络程序比较简单,容易实现。当希望能够立即发送和接收数据,且处理的套接字数量比较少的情况下,使用阻塞模式来开发网络程序比较合适。

    阻塞模式套接字的不足表现为,在大量建立好的套接字线程之间进行通信时比较困难。当使用“生产者-消费者”模型开发网络程序时,为每个套接字都分别分配一个读线程、一个处理数据线程和一个用于同步的事件,那么这样无疑加大系统的开销。其最大的缺点是当希望同时处理大量套接字时,将无从下手,其扩展性很差



(2)非阻塞IO模型 

    非阻塞IO通过进程反复调用IO函数(多次系统调用,并马上返回);在数据拷贝的过程中,进程是阻塞的;

    我们把一个SOCKET接口设置为非阻塞就是告诉内核,当所请求的I/O操作无法完成时,不要将进程睡眠,而是返回一个错误。这样我们的I/O操作函数将不断的测试数据是否已经准备好,如果没有准备好,继续测试,直到数据准备好为止。在这个不断测试的过程中,会大量的占用CPU的时间。
    把SOCKET设置为非阻塞模式,即通知系统内核:在调用Windows Sockets API时,不要让线程睡眠,而应该让函数立即返回。在返回时,该函数返回一个错误代码。图所示,一个非阻塞模式套接字多次调用recv()函数的过程。前三次调用recv()函数时,内核数据还没有准备好。因此,该函数立即返回WSAEWOULDBLOCK错误代码。第四次调用recv()函数时,数据已经准备好,被复制到应用程序的缓冲区中,recv()函数返回成功指示,应用程序开始处理数据。




(3)IO复用模型
    主要是select和epoll;对一个IO端口,两次调用,两次返回,比阻塞IO并没有什么优越性;关键是能实现同时对多个IO端口进行监听;
    I/O复用模型会用到select、poll、epoll函数,这几个函数也会使进程阻塞,但是和阻塞I/O所不同的的,这两个函数可以同时阻塞多个I/O操作。而且可以同时对多个读操作,多个写操作的I/O函数进行检测,直到有数据可读或可写时,才真正调用I/O操作函数。


(4)信号驱动IO

    两次调用,两次返回;首先我们允许套接口进行信号驱动I/O,并安装一个信号处理函数,进程继续运行并不阻塞。当数据准备好时,进程会收到一个SIGIO信号,可以在信号处理函数中调用I/O操作函数处理数据。


(5)异步IO模型
    数据拷贝的时候进程无需阻塞。当一个异步过程调用发出后,调用者不能立刻得到结果。实际处理这个调用的部件在完成后,通过状态、通知和回调来通知调用者的输入输出操作



5个I/O模型的比较:


相关推荐
©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页