并发的级别
由于临界区的存在,多线程之间的并发必须受到控制。根据控制并发的策略,我们可以把并发的级别分类,大致上可以分为阻塞、无饥饿、无障碍、无锁、无等待几种。
1.阻塞
一个线程是阻塞的,那么在其他线程释放资源之前,当前线程无法继续执行。当我们使用synchronized关键字或者重入锁时,我们得到的线程就是阻塞的线程。
无论是synchronized或者重入锁,都会试图在执行后续代码前,得到临界区的锁,如果得不到,线程就会被挂起等待,直到占有了所需资源为止。
2.无饥饿
如果线程之间是有优先级的,那么线程的调度总是会倾向于满足高优先级的线程。也就是说,对于同一个资源的分配,是不公平的!对于非公平的锁来说,系统允许高优先级的线程插队。这样有可能导致低优先级的线程产生饥饿。如果锁是公平的,满足先来后到,那么饥饿就不会产生,不管新来的线程优先级有多高,要想获得资源,就必须乖乖排队,那么所有的线程都有机会执行。
3. 无障碍
无障碍是一种最弱的非阻塞调度。两个线程如果是无障碍的执行,那么他们不会因为临界区的问题导致一方被挂起。换言之,大家都可以进入临界区。
那么大家一起修改共享数据,把数据改坏了可怎么办呢?
对于无障碍的线程来说,一旦检测到这种情况,它就会立即对自己所做的修改进行回滚,确保数据安全。但如果没有数据竞争发生,那么线程就可以顺利的完成自己的工作,走出临界区。
如果说阻塞的控制方式是悲观策略,也就是说,系统认为两个线程之间很有可能发生不幸的冲突,因此,以保护数据为第一优先级。相对来说,非阻塞的调度就是一种乐观的策略。它认为多个线程之间不会发生冲突,或者说这种概率不大,因此大家都应该无障碍的执行,但是一旦检测到冲突,就应该继续回滚。
无障碍的多线程程序并不一定能顺畅的运行,因为当临界区中存在严重的冲突时,所有线程都可能会不断回滚自己的操作,而没有一个线程可以走出临界区。这种情况会影响系统正常执行。我们希望这一堆线程中,至少有一个线程能走出临界区。
一种可行的无障碍实现可以依赖一个“一致性标记”来实现。线程在操作之前,先读取并保存这个标记,在操作完成之后,再次读取,检查这个标记是否被更改过,如果两者是一致的,则说明资源访问没有冲突。如果不一致,则说明资源可能在操作过程中与其他写线程冲突,需要重试操作。而任何对资源有修改操作的线程,在修改数据前,都需要更新这个一致性标记,表示数据不再安全。
4. 无锁
无锁的并行都是无障碍的,在无锁的情况下,所有的线程都能尝试对临界区进行访问,但不同的是,无锁的并发保证必然有一个线程能够在有限步内完成操作离开临界区。
在无锁的调用中,一个典型的特点是可能会包含一个无穷循环。在这个循环中,线程会不断尝试修改共享变量。如果没有冲突,修改成功,那么程序退出,否则继续尝试修改。但无论如何,无锁的并行总能保证有一个线程是可以胜出的,不至于全军覆没。至于临界区中竞争失败的线程,他们则不断重试,直达自己获胜。如果运气很不好,总是尝试不成功,则会出现类似饥饿的现场,线程停滞不前。
5. 无等待
无锁只要求有一个线程可以在有限步内完成操作,而无等待则在无锁的基础上更进一步进行扩展。它要求所有线程都必须在有限步内完成,这样就不会引起饥饿问题。
一种典型的无等待结构就是RCU(read-copy-update)。它的基本思想是,对数据的读可以不加控制。因此,所有的读线程都是无等待的,他们既不会被锁定等待也不会引起任何冲突。但是在写的时候,先取得原始数据的副本,接着只修改副本数据,修改完成后,在合适的时机回写数据。