第六章 Java内存模型与线程

最新推荐文章于 2024-01-15 22:44:10 发布

qq_36091872

最新推荐文章于 2024-01-15 22:44:10 发布

阅读量102

点赞数

分类专栏： JVM

JVM 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

文章目录

硬件效率与一致性
Java内存模型
Java与线程

硬件效率与一致性

由于存储设备和处理器运算速度之间的存在巨大的差异，现在计算机系统在内存与处理器之间加入高速缓存来作为处理器与内存之间的缓冲。将处理器需要的数据复制到缓存中，让处理器可以快速的获取数据进行计算，计算结束后再从缓存同步带内存中去，这样处理器无需等待缓慢的内存读写。

如此引入了一个新的问题：缓存的一致性。在一个多处理器系统中，每个处理器有自己的高速缓存，而它们又共享同一主存，这样在运算的时候会出现多个处理器的缓存不一致问题。对于这个问题需要用到缓存一致协议。缓存一致性机制会阻止同时修改由两个以上处理器缓存的内存区域数据。

在这里插入图片描述
除了增加高速缓存外，为了使得处理器内部的运算单元能尽量被充分利用，处理器可能会对输入代码进行乱序执行优化。与处理器的乱序执行优化类似，Java虚拟机的即时编译器中也有类似的指令重排序优化。

Java内存模型

屏蔽掉各种硬件和操作系统的内存访问差异。

主内存与工作内存

在这里插入图片描述
每条Java线程有自己的工作内存（相当于一个高速缓存），工作内存中保存了线程需要的变量的主内存副本拷贝。线程对变量的操作必须在工作内存中进行而不是直接写入主内存中的变量。不同线程间也无法直接直接访问对方工作内存，线程间变量值传递还是需要主内存。

这里的工作内存、主内存与Java内存区域中的Java堆、栈、方法区等并不是同一层次的内存划分，如果两者一定要勉强对应起来，主内存主要对应于Java堆中的对象实例数据部分，而工作内存则对应于虚拟机栈中部分区域。线程私有的变量并不需要同步。

内存间交互操作

工作内存和主内存之间的交互协议，即如何将一个变量从主内存拷贝到工作内存、如何从工作内存同步回主内存，Java内存模型使用了8种原子操作来完成。
在这里插入图片描述
如果把一个变量从主内存复制到工作内存，按顺序执行read和load操作；如果把变量从工作内存同步回主内存，按顺序执行store和write操作。Java内存模型还规定在执行上述8种基本操作时必须满足如下规则：

不允许read和load、store和write操作之一单独出现，即不允许一个变量从主内存读取了但工作内存不接受，或者从工作内存发起回写了但主内存不接受的情况。
不允许一个线程丢弃它的最近assign操作，即变量在工作内存中改变了之后必须把该变化同步回主内存。
不允许一个线程无原因的（没有发生过任何assign操作）把数据从线程的工作内存同步回主内存中。
一个新的变量只能在主内存中“诞生”，不允许在工作内存中直接使用一个未被初始化（load或assign）的变量，就是对一个变量执行use和store之前必须先执行过了assign和load操作。
一个变量在同一个时刻只允许一条线程对其进行lock操作，但lock操作可以被同一条线程重复执行多次，多次执行lock后，只有执行相同次数的unlock操作，变量才会被解锁。
如果对一个变量执行lock操作，那么会清空工作内存中此变量的值，在执行引擎使用这个变量前，需要重新执行load或assign操作初始化变量的值。
如果一个变量事先没有被lock操作锁定，则不允许对它执行unlock操作，也不允许去unlock一个被其他线程锁定住的变量。
对一个变量执行unlock操作之前，必须先把此变量同步回主内存中（执行store和write操作）。

对于volatile型变量的特殊规则

关键字volatile可以说是Java虚拟机提供的最轻量级的同步机制。

当一个变量被定义成volatile后，它将具备两种特性：
（1）第一是保证对所有线程的可见性，“可见性”指当一条线程修改了这个变量的值，新值对于其他线程来说是可以立即得知的，这是通过Java内存模型实现的。但是Java里面的运算并非原子操作，导致volatile变量的运算在并发下一样是不安全的。

public class VolatileTest {
    public static volatile int race = 0;
    private static final int THREADS_COUNT = 20;
    
    public static void increase(){
        race++;
    }
    
    public static void main(String[] args) {
        Thread[] threads = new Thread[THREADS_COUNT];
        for(int i = 0; i < THREADS_COUNT; i++){
            threads[i] = new Thread(new Runnable() {
                @Override
                public void run() {
                    for(int i = 0; i < 10000; i++){
                        increase();
                    }
                }
            });
            threads[i].start();
        }
        
        //等待所有累加线程都结束
        while (Thread.activeCount() > 1) {
            Thread.yield();
        }
        
        System.out.println(race);
    }
}

运行结果1：
156636

运行结果2：
118021

如果这段代码能够正确并发运行的话，最后的输出结果应该是200000。但并没有得到预期的结果，而且每次输出结果可能都不一样。

问题就出现在自增运算“race++”之中，用javap反编译这段代码，发现只有一行代码的increase()方法在Class文件中由4条字节码指令构成（return指令不是由race++产生的，这条指令可以不计算），从字节码层面容易分析并发失败的原因了：当getstatic指令把race的值取到操作栈顶时，volatile关键字保证了race的值在此时是正确的，但是在执行iconst_1, iadd这些指令时，其他线程可能已经把race的值加大了，而操作栈顶的值就变成了过期的数据，所以putstatic指令执行后就可能把较小的race值同步回主内存中。

  public static void increase();
    descriptor: ()V
    flags: ACC_PUBLIC, ACC_STATIC
    Code:
      stack=2, locals=0, args_size=0
         0: getstatic     #13                 // Field race:I
         3: iconst_1
         4: iadd
         5: putstatic     #13                 // Field race:I
         8: return
      LineNumberTable:
        line 12: 0
        line 13: 8
      LocalVariableTable:
        Start  Length  Slot  Name   Signature

客观地说，此时使用字节码来分析并发问题，仍然是不严谨的，因为即使编译出来只有一条指令，也并不意味执行这条指令就是一个原子操作。一条字节码指令在解释执行时，解释器将要运行许多行代码才能实现它的语义，如果是编译执行，一条字节码指令也可能转化成若干条本地机器码指令，此处使用 -XX:+PrintAssembly 参数输出反编译来分析会更加严谨一些。

由于volatile变量只能保证可见性，在不符合以下两条规则的运算场景中，我们仍然要通过加锁（使用synchronized或java.util.concurrent中的原子类）来保证原子性：

运算结果并不依赖变量的当前值，或者能够确保只有单一的线程修改变量的值。
变量不需要与其他的状态变量共同参与不变约束。

（2）使用volatile变量的第二个语义是禁止指令重排序优化，普通变量仅仅会保证在该方法的执行过程中所有依赖赋值结果的地方都能获取到正确的结果，而不能保证变量赋值操作的顺序与程序代码中的执行顺序一致。因为在一个线程的方法执行过程中无法感知到这点，这也就是Java内存模型中描述的所谓的“线程内表现为串行的语义”（WithinThread As-If-Serial Semantics）。

我们可以继续通过一个例子来看看为何指令重排序会干扰程序的并发执行：

Map configOptions;
char[] configText;

//此处必须为Volatile
Volatile boolean initialized=flase;

//假设以下代码在线程A中执行
//模拟读取配置信息，当读取完成后将 initialized 设置为true以通知其他线程配置可用
configOptions=new HashMap();
configText=readConfigFile(fileName);
processConfigOptions(configText, configOptions);
initialized=true;

//假设以下代码在线程B中执行
//等待 initialized 为true，线程A已经把配置信息初始化完成
while(!initialized){
         sleep();
}
//使用线程A初始化好的配置信息
doSomethingWithConfig();

这是一段伪代码，但是如果不使用Volatile关键字，那么就可能由于指令重排序的优化，导致位于线程A中最后一句的代码“initialized=true”被提前执行，这样线程B中使用配置信息的代码就可能出现错误，而Volatile关键字则可以避免此类情况发生。

查看汇编代码，Volatile修饰的变量。赋值后多执行了一个“lock addl $0x0, (%esp)”操作，这个操作相当于一个内存屏障，指令重排序时不能把后面的指令重排序到内存屏障之前的位置。

在众多保障并发安全工具中选用volatile的意义：在某些情况下，volatile的同步机制的性能确实要优先于锁（使用synchronized关键字或java.util.concurrent包里面的锁），但是由于虚拟机对锁实行的许多消除和优化，使得很难量化地认为volatile就会比synchronized快多少。volatile变量的读操作的性能消耗与普通变量几乎没有差别，但写操作可能会慢一些，因为它需要在本地代码中插入许多内存屏障指令来保证处理器不发生乱序执行。不过即便如此，大多数场景下volatile的总开销仍然要比锁低，我们在volatile与锁之中选择的唯一依据仅仅是volatile的语义能否满足使用场景的需求。

java内存模型中对volatile变量定义的特殊规则。假定T表示一个线程，V和W分别表示volatile型变量，那么在进行read、load、use、assign、store和write操作时需要满足如下规则：

只有当线程T对变量V执行的前一个动作为load时，T才能对V执行use；并且，只有T对V执行的后一个动作为use时，T才能对V执行load。T对V的use动作可以认为是和T对V的load、read动作相关联，必须连续一起出现（这条规则要求在工作内存中，每次使用V前都必须先从主内存刷新最新的值，用于保证能看见其他线程对V修改后的值）。
只有当T对V的前一个动作是assign时，T才能对V执行store；并且，只有当T对V执行的后一个动作是store时，T才能对V执行assign。T对V的assign可以认为和T对V的store、write相关联，必须连续一起出现（这条规则要求在工作内存中，每次修改V后都必须立刻同步回主内存中，用于保证其他线程看到自己对V的修改）。
假定动作A是T对V实施的use或assign动作，假定动作F是和动作A相关联的load或store动作，假定动作P是和动作F相应的对V的read或write动作；类似的，假定动作B是T对W实施的use或assign动作，假定动作G是和动作B相关联的load或store动作，假定动作Q是和动作G相应的对W的read或write动作。如果A先于B，那么P先于Q（这条规则要求volatile修饰的变量不会被指令的重排序优化，保证代码的执行顺序与程序的顺序相同）。
当第二个操作是volatile写时，不管第一个操作是什么，都不能重排序。这个规则确保 volatile写之前的操作不会被编译器重排序到volatile写之后。
当第一个操作是volatile读时，不管第二个操作是什么，都不能重排序。这个规则确保volatile读之后的操作不会被编译器重排序到volatile读之前。
当第一个操作是volatile写，第二个操作是volatile读时，不能重排序。

对final特殊规则

对于final域，编译器和处理器要遵守两个重排序规则：

在构造函数内对一个final域的写入，与随后把这个被构造对象的引用赋值给一个引用变量，这两个操作之间不能重排序。
初次读一个包含final域的对象的引用，与随后初次读这个final域，这两个操作之间不能重排序。

对long和double型变量的特殊规则

允许虚拟机将没有被volatile修饰的64位数据类型（long和double）的读取操作划分为两次32位的操作来进行，即允许虚拟机实现选择可以不保证64位数据类型的load、store、read和write这4个操作的原子性，就点就是long和double的非原子协定（Nonatomic Treatment of double and long Variables）。

如果多个线程共享一个为声明为volatile的long或double类型变量，并同时对他们进行读取和修改操作，那么有些线程可能会读取到一个即非原值，也不是其他线程修改值得代表了“半个变量”的数值。

不过这种读取带“半个变量”的情况非常罕见（在目前商用虚拟机中不会出现），因为Java内存模型虽然允许虚拟机不把long和double变量的读写实现成原子操作，但允许虚拟机选择把这些操作实现为具有原子性的操作，而且还“强烈建议”虚拟机这样实现。

原子性、可见性和有序性

原子性（Atomicity）：由Java内存模型来直接保证的原子性变量操作包括read、load、assign、use、store和write，我们大致可以认为基本数据类型的访问具备原子性（long和double例外）。

如果应用场景需要一个更大范围的原子性保证，Java内存模型还提供了lock和unlock操作来满足需求，尽管虚拟机未把lock和unlock操作直接开放给用户，但是却提供了更高层次的字节码指令monitorenter和monitorexit来隐式地使用这两个操作，这两个字节码指令反应到Java代码中就是同步块——synchronized关键字，因此在synchronized块之间的操作也具备原子性。

另外介绍一下处理器是如何实现原子操作的（具体内容参考Java并发编程的艺术第二章）：

通过总线锁保证原子性
通过缓存锁定保证原子性

可见性（Visibility）：指当一个线程修改了共享变量的值，其他线程能够立即得知这个修改。

除了volatile，Java还有两个关键字能实现可见性，synchronized和final。同步块的可见性是由“对一个变量执行unlock操作之前，必须把此变量同步回主内存中（执行store和write操作）”这条规则获得的，而final关键字的可见性是指：被final修饰的字段在构造器中一旦被初始化完成，并且构造器没有把“this”的引用传递出去（this引用逃逸是一件很危险的事情，其他线程有可能通过这个引用访问到“初始化了一半”的对象），那么其他线程中就能看见final字段的值。

//变量i与j都具备可见性，它们无须同步就能被其他线程正确访问
    public static final int i;
    public final int j;
    
    static{
        i = 0;
        //do something
    }
    
    {
        //也可以选择在构造函数中初始化
        j = 0;
        //do something
    }

有序性（Ordering）：Java程序中天然的有序性可以总结为一句话：如果在本线程内观察，所有的操作都是有序的；如果在一个线程中观察另外一个线程，所有的操作都是无序的。前半句是指“线程内表现为串行的语义”（Within-Thread As-if-Serial Semantics），后半句是指“指令重排序”现象和“工作内存与主内存同步延迟”现象。

Java语言提供了volatile和synchronized两个关键字来保证线程之间操作的有序性，volatile关键字本身就包含了禁止指令重排序的语义，而synchronized则是由“一个变量在同一时刻只允许一条线程对其进行lock操作”这条规则获得的，这个规则决定了持有同一个锁的两个同步块只能串行地进入。

先行发生原则：先行发生是Java内存模型中定义的两项操作之间的偏序关系，如果操作A先行发生于操作B，其实就是说在发生操作B之前，操作A产生的影响能被操作B观察到，“影响”包括修改了内存中共享变量的值、发送了消息、调用了方法等。

    i = 1；//在线程A中执行
    j = i;//在线程B中执行
    i = 2;//在线程C中执行
    //A先于B，但是C与B没有先行关系，B存在读取过期数据风险，不具备多线程安全性

下面是Java内存模型下一些“天然的”先行发生关系，无须任何同步器协助就已经存在，可在编码中使直接使用。如果两个操作之间的关系不在此列，并且无法从下列规则推倒出来，它们就没有顺序性的保障，虚拟机可以对它们进行随意地重排序。

程序次序规则（Program Order Rule）：在一个线程内，按照程序代码顺序，书写在前面的操作先行发生于书写在后面的操作。准确地来说应该是控制流顺序而不是程序代码顺序，因为要考虑分支、循环结构。
管程锁定规则（Monitor Lock Rule）：一个unlock操作先行发生于后面对同一锁的lock操作。这里必须强调的是同一锁，而“后面”是指时间上的先后顺序。
volatile变量规则（Volatile Variable Rule）：对一个volatile变量的写操作先行发生于后面对这个变量的读操作，这里的“后面”是指时间上的先后顺序。
线程启动规则（Thread Start Rule）：Thread对象的start()方法先行发生于此线程的每一个动作。
线程终止规则（Thread Termination Rule）：线程中的所有操作都先行发生于对此线程的终止检测，我们可以通过Thread.join()方法结束/Thread.isAlive()的返回值等手段检测到县城已经终止执行。
线程中断规则（Thread Interruption Rule）：对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生，可以通过Thread.interrupted()方法检测到是否有中断发生。
对象终结规则（Finalizer Rule）：一个对象的初始化完成（构造函数执行结束）先行发生于它的finalize()方法的开始。
传递性（Transitivity）：如果操作A先行发生于操作B，操作B先行发生于操作C，那么操作A先行发生于操作C。

时间上的先后顺序与先行发生原则之间基本没有太大的关系，所以我们衡量并发安全问题时不要受时间顺序的干扰，一切必须以先行发生原则为准。

Java与线程

线程的实现

主流操作系统都提供了线程实现，Java语言则提供了在不同硬件和操作系统平台对线程操作的同一处理，每个java.lang.Thread类的实例就代表了一个线程。Thread类与大部分Java API有着显著的差别，它的所有关键方法都被声明为Native。在Java API中一个Native方法可能就意味着这个方法没有使用或无法使用平台无关的手段实现。正因为这个原因，我们这里的“线程的实现”而不是“Java线程的实现”。

实现线程主要三种方式：
（1）使用内核线程实现：
内核线程（Kernel Thread， KLT）就是直接由操作系统内核（Kernel，下称内核）支持的线程，这种线程由内核来完成线程切换，内核通过操纵调度器（Scheduler）对线程进行调度，并负责将线程的任务映射到各个处理器上。每个内核线程都可以看作是内核的一个分身，这样操作系统就有能力同时处理多件事情，支持多线程的内核就叫多线程内核（Multi-Thread Kernel）。

程序一般不会直接去使用内核线程，而是去使用内核线程的一种高级接口——轻量级进程（Light Weight Process， LWP），轻量级进程就是我们通常意义上所讲的线程，由于每个轻量级进程都由一个内核线程支持，因此只有先支持内核线程，才能有轻量级进程。这种轻量级进程与内核线程之间1：1的关系称为一对一的线程模型。
在这里插入图片描述
轻量级进程的局限性：首先，由于是基于内核线程实现的，所以各种线程操作，如创建、析构及同步，都需要进行系统调用。而系统调用的代价相对较高，需要在用户态（User Mode）和内核态（Kernel Mode）中来回切换；其次，每个轻量级进程都需要有一个内核线程的支持，因此轻量级进程需要消耗一定的内核资源（如内核线程的栈空间），因此一个系统支持轻量级进程是有限的。

（2）使用用户线程实现：
广义上来说，只要不是内核线程就可以认为是用户线程，因此可以认为轻量级进程也属于用户线程。狭义上说是完全建立在用户空间的线程库上的并且内核系统不可感知的。

而狭义上的用户线程指的是完全建立在用户空间的线程库上，系统内核不能感知到线程存在的实现。用户线程的建立、同步、销毁和调度完全在用户态完成，不需要内核的帮助。如果程序实现得当，这种线程不需要切换到内核态，因此操作快速且低消耗，也可以支持规模更大的线程数量，部分高性能数据库中的多线程就是由用户线程实现的。这种进程与用户线程之间1：N的关系称为一对多的线程模型。
在这里插入图片描述

用户线程的优点是不需要内核支援，所以他说快速低消耗的。劣势在于没有内核线程的支援，线程的创建、切换和调度都是要考虑的问题，而且操作系统只是把处理器资源分配到进程，那诸如“阻塞如何处理”、“多处理器系统中如何把线程映射到其他处理器上”这类问题解决起来将会异常困难。现在Java都放弃这个方式了。
（3）使用用户线程加轻量级进程混合实现：
既存在用户线程，也存在轻量级进程。上面UT就是用户线程，一个轻量级进程LWP可以支持一个或多个UT，每个LWP又是有一个KTL支持的。这种实现方式的特点有:

用户线程还是完全建立在用户空间中，用户线程的创建、切换、析构、操作依旧廉价，并可以支持大规模用户线程并发。
LWP作为用户线程和内核线程的桥梁，可以使用内核线程提供的线程调度功能和处理器映射。
用户线程的系统调用需要通过LWP完成，可以降低整个进程被阻塞的风险。
这种实现方式用户线程和轻量级进程的关系是N:M。

在这里插入图片描述

Java线程的实现：
平台不同实现方式不同
线程模型只对线程的并发模型和操作成本产生影响，对Java程序的编码和运行来说，这些差异都是透明的。

Java线程调度

线程调度是指系统为线程分配处理器使用权的过程。主要调度方式两种：

使用协同式调度的多线程系统，线程执行时间由线程本身控制，线程把自己的工作执行完后，要主动通知系统切换到另外一个线程上去。优点：实现简单。缺点：执行时间不可控制。甚至一个线程编写有问题，一直不告知系统进行线程切换，那么程序会一直阻塞在那里。
使用抢占调用的多线程系统，每个线程由系统分配执行时间，线程的切换不由线程本身决定。Java使用的就是这种线程调度方式。

Java提供10个级别的线程优先级设置，不过，线程优先级不靠谱，因为Java线程是被映射到系统的原生线程上实现的，所以线程调度最终还是由操作系统决定。

状态转换

Java语言定义了5种线程的状态，在任意一个时间点，一个线程有且只有一种状态。

新建（New）：线程被创建但是未启动。
运行（Runable）：包括Running和Ready，处于此状态的线程可能在运行或者是Ready状态等待CPU时间的分配。
无期限等待（Waiting）：处于此状态的线程不会被分配CPU时间，需要等待其他线程显示唤醒。下面几种方式可以时线程进入无期限等待状态：
（1）没有设置参数的Object.wait()方法。
（2）没有设置参数的Thread.join()方法。
（3）LockSupport.park()方法
有期限等待（Timed Waiting）：处于这种状态的线程不会被分配CPU时间，但是不需要等待被其他线程唤醒，系统在一定时间后会唤醒这种状态的线程。以下几种方法可以使线程进入有期限等待状态：
（1）Thread.sleep()方法
（2）设置了参数的Object.wait()方法。
（3）没有设置了参数的Thread.join()方法。
（4）LockSupport.parkNaos()方法
（5）LockSupport.parkUntil()方法
阻塞状态（Blocked）：与等待状态的区别是，阻塞状态等待获取到一个排他锁，这个事件将在另外一个线程放弃这个锁的时候发生；而“等待状态”则是在等待一段时间，或者唤醒动作的发生。线程在等待进入同步区域的时候处于这种状态。
结束：已经终止的线程处于的状态。

线程状态转换图：
在这里插入图片描述
注意：Java将操作系统中的运行和就绪两个状态合并称为运行状态。阻塞状态是线程阻塞在进入synchronized关键字修饰的方法或代码块（获取锁）时的状态，但是阻塞在java.concurrent包中Lock接口的线程状态却是等待状态，因为java.concurrent包中Lock接口对于阻塞的实现均使用了LockSupport类中的相关方法。

易混淆的几个方法的区别

1、wait() 方法：

wait是Object类的方法
wait，notify和notifyAll只能在同步控制方法或者同步控制块里面使用
wait声明抛出InterruptedException异常，但是notify和notifyAll没有声明异常
先释放锁，再进入等待状态；
使当前线程暂停运行，让出CPU，不再参与CPU的调度，直到被唤醒为止；

2、sleep() 方法：

sleep方法属于Thread类中方法，声明抛出InterruptedException异常
在睡眠过程中，不释放锁；
sleep()方法给其他线程运行机会时不考虑线程的优先级，因此会给低优先级的线程以运行的机会；

3、yield() 方法：

yield()方法没有声明任何异常；
不释放锁
使当前线程暂停运行，给同等优先级或高优先级的线程让出CPU。但有可能让出CPU失败，因为调用yield( )方法后，当前线程由运行状态，变成就绪状态，会马上参与CPU的调度，也就说可能再次被调度，当前线程依旧占用着CPU。
执行yield()方法后转入就绪（ready）状态；

4、join() 方法

声明抛出 InterruptedException异常
join方法是用于在某一个线程的执行过程中调用另一个线程执行，等到被调用的线程执行结束后，再继续执行当前线程。

参考：

《深入理解Java虚拟机》–周志明
https://blog.csdn.net/csdn_blog_lcl/article/details/80631242
https://blog.csdn.net/qq_41701956/article/details/81664921

qq_36091872

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
第六章 Java内存模型与线程

硬件效率与一致性由于存储设备和处理器运算速度之间的存在巨大的差异，现在计算机系统在内存与处理器之间加入高速缓存来作为处理器与内存之间的缓冲。将处理器需要的数据复制到缓存中，让处理器可以快速的获取数据进行计算，计算结束后再从缓存同步带内存中去，这样处理器无需等待缓慢的内存读写。如此引入了一个新的问题：缓存的一致性。在一个多处理器系统中，每个处理器有自己的高速缓存，而它们又共享同一主存，这样在运算...
复制链接

扫一扫

专栏目录