多个进程或线程并发执行,其复杂性在于,一旦它们相互之间有依赖关系,则它们的交互过程或计算步骤的顺序将可能存在不确定性,从而使各个进程或线程的正确性难以保证和分析。通常,操作系统会提供一些同步原语供这些进程或线程使用,从而限制它们的计算必须按照特点的约束来进行。另一方面,程序设计语言有可能会提供一些语法要素来保证数据结构的一致性或代码片段的不可重入特性。
我们看一个简单的程序。图5.1显示了一个计算线程和一个控制线程。计算线程根据全局变量g_nCount的值来循环执行计算任务,当g_nCount达到100时,循环结束,从而计算线程退出。控制线程在创建了计算线程以后,在它终止以前,可以通过将g_nCount赋值为100的方式通知计算线程不必再执行计算任务了。因此,计算线程和控制线程通过一个全局变量进行通信。
这两段代码逻辑上看是没有错,并且运行时候也许符合预期的效果,但若仔细检查生成的汇编代码,就发现,如果线程切换发生在图5.1(a)展示的5条汇编指令的第2条或第3条之后,那么,即使控制线程已经将全局变量g_nCount赋值为100,计算线程接下来的mov指令也会覆盖掉刚刚的赋的值,从而使控制线程中的g_nCount=100,这条语句完全不起作用。更有甚者,如果编译优化打开了的话,计算线程的循环过程可能直接通过一个寄存器来控制,而根本不访问g_nCount的内存单元。为避免这种优化,可以将g_nCount变量声明为volatile(volatile的变量是说这变量可能会被意