1.概括
并发是指一次处理多件事,并行是指一次做多件事。二者不同,但是有一定的联系。一个关于结构,一个关于执行。并发用于制定方案,用来解决可能(但未必)并行的问题。真正的并行需要有多个核心,假设现在的电脑有四个CPU核心。但是通常不经意间就有唱过100个进程同时运行。因此,实际上大多数过程都是并发处理的,而不是并行处理。计算机始终UN行者100多个进程,确保每个进程都有机会取得进展,但是CPU同时做的事情不超过4件。
2.线程与协程对比
下面给出一个函数的线程版和协程版。
import asyncio
import threading
def supervisor():
signal = Signal()
spinner = threading.Thread(target=spin, args=('thinking', signal))
print('spinner object:', spinner)
spinner.start()
result = slow_function()
signal.go = False
spinner.join()
return result
@asyncio.coroutine
def supervisor():
spinner = asyncio.async(spin('thinking'))
print('spinner object:', spinner)
result = yield from slow_function()
spinner.cancel()
return result
通过两段代码的比较,可以发现:
(1)asyncio.Task对象差不多与threading.Thread对象等效,Task对象像是协作式多任务的库中的绿色线程。
(2)Task对象用于驱动协程(含yield关键字),Thread对象用于调用可调用的对象,
(3)Task对象不能自己手动实例化,而是通过协程传给asyncio.async()函数或loop.create_task()方法获取。
(4)获取的Task对象已经排定了运行时间,Thread实例则必须调用start方法,明确告知它运行。
(5)在线程版的supervisor函数中,slow_function函数是普通的函数,直接由线程调用。在异步版supervisor函数中,solw_function函数是协程,由yield from驱动。
(6)没有API能从外部终止线程,因为线程随时可能中断,导致系统处于无效状态。如果想终止任务,可以使用Task.cancel()实例方法,在协程内部抛出异常。
(7)supervisor协程必须在main函数中由loop.run_until_complete方法执行。
此外,还要注意一点,如果使用线程做过于重要的编程,写出程序会比较困难。因为调度程序在任何时候都能中断线程。所以要记住保留锁,去保护程序中重要的部分。而协程会默认做好全方位的保护,以防止中断。我们必须显式的产出才能让程序的余下部分运行。对协程来说,无需保留锁,在多个线程之间同步操作,协程自身就会同步,因为在任意时刻只有一个协程在运行。想交出控制权,可以使用yield或yield from把控制权交给调度程序。
3.避免阻塞型调用
通常情况下,有两种方法能避免阻塞型调用终止整个应用程序的进程:
(1)在单独的线程中运行各个阻塞型操作。
(2)把每个阻塞型操作转换成非阻塞的异步调用。
使用多个线程是可以的,但是这样做内内存的需求量太大,我们负担不起。所以,为了降低内存消耗,通过使用回调来实现异步调用,即使用回调时,我们不等待响应,而是注册一个函数,在发生某件事时调用。这样所有调用都是非阻塞的。