我之前翻译了一系列的关于并发模型的教程文章,有网友对其中的流水线模型表示不是很理解。实际上当时进行翻译的时候自己也是一知半解,不过现在可以作进一步的介绍。
典型的流水线模式如下如:
可以这样理解,例如:一个任务分成三个步骤完成,将这三个步骤分成了三个 Worker
- 假设现在一个任务的第一个步骤已经完成了,那么它将到达第二个步骤
- 如果此时又来了一个新的任务,那么第一个任务的第二个步骤和第二个任务的第一个步骤将并发的执行
- 只要任务是多个,就可能产生并发
- 如果任务只有一个,或者第二个任务到达时第一个任务已经全部被执行完,此时就不会有并发。
让网友不是很理解的是下面这张图中非阻塞式IO
这里有两点很重要
- 程序中的IO操作通常是费时的
- IO操作是交由操作系统完成的
上面两点说明,IO操作不应该占用我们的线程时间,而自然而然的应该作为 Worker 和 Worker 的分割界面,这样的效率最高。这里建议参考 Nodejs 的设计方法,举个例子,程序读取本地文件并进行处理,然后传给远端,并等待传输完成给用户一个成功或失败的提示,可以如下图做 worker 分割,
未完待续。。。