多个执行线程经常要共享数据,如果仅仅读取共享数据还好,但是如果多个线程要修改共享数据的话就可能出现无法预料的结果。
假如两个线程对象t1 和t2 都要对数值num=0 进行增1运算,那么t1 和t2 都各对num 修改10 次的话,那么num 最终的结果应该为20 。但是如果当t1 取得num 的值时(假如此时num 为0 ),系统把t1 调度为“sleeping ”状态,而此时t2 转换为“running ”状态,此时t2 获得的num 的值也为0 ,然后他把num+1 的值1 赋给num 。系统又把t2 转化为“sleeping ”状态,t1 为“running ”状态,由于t1 已经得到num 值为0 ,所以他也把num+1 的值赋给了num 为1 。本来是2 次增1 运行,结果却是num 只增了1 次。类似这样的情况在多线程同时执行的时候是有可能发生的。所以为了防止这类情况的出现就要使用线程同步机制。
最简单的同步机制就是“锁”
锁对象用threading.RLock 类创建
mylock = threading.RLock()
如何使用锁来同步线程呢?线程可以使用锁的acquire() (获得)方法,这样锁就进入“locked ”状态。每次只有一个线程可以获得锁。如果当另一个线程试图获得这个锁的时候,就会被系统变为“blocked ”状态,直到那个拥有锁的线程调用锁的release() (释放)方法,这样锁就会进入“unlocked ”状态。“blocked ”状态的线程就会收到一个通知,并有权利获得锁。如果多个线程处于“blocked ”状态,所有线程都会先解除“blocked ”状态,然后系统选择一个线程来获得锁,其他的线程继续沉默(“blocked ”)。
import threading
mylock = threading.RLock()
class mythread(threading.Thread)
...
def run(self ...):
... #此处 不可以 放置修改共享数据的代码
mylock.acquire()
... #此处 可以 放置修改共享数据的代码
mylock.release()
... #此处 不可以 放置修改共享数据的代码
我们把修改共享数据的代码称为“临界区”,必须将所有“临界区”都封闭在同一锁对象的acquire() 和release() 方法调用之间。
锁只能提供最基本的同步级别。有时需要更复杂的线程同步,例如只在发生某些事件时才访问一个临界区(例如当某个数值改变时)。这就要使用“条件变量”。
条件变量用threading.Condition 类创建
mycondition = threading.Condition()
条件变量是如何工作的呢?首先一个线程成功获得一个条件变量后,调用此条件变量的wait() 方法会导致这个线程释放这个锁,并进入“blocked ”状态,直到另一个线程调用同一个条件变量的notify() 方法来唤醒那个进入“blocked ”状态的线程。如果调用这个条件变量的notifyAll() 方法的话就会唤醒所有的在等待的线程。
如果程序或者线程永远处于“blocked ”状态的话,就会发生死锁。所以如果使用了锁、条件变量等同步机制的话,一定要注意仔细检查,防止死锁情况的发生。对于可能产生异常的临界区要使用异常处理机制中的finally 子句来保证释放锁。等待一个条件变量的线程必须用notify() 方法显式的唤醒,否则就永远沉默。保证每一个wait() 方法调用都有一个相对应的notify() 调用,当然也可以调用notifyAll() 方法以防万一。