《深入理解Java虚拟机》读书笔记----Java内存模型与线程

最新推荐文章于 2024-07-24 17:27:32 发布

JaneRoad

最新推荐文章于 2024-07-24 17:27:32 发布

阅读量111

点赞数

文章标签：多线程 java 编程语言 linux 数据库

本文链接：https://blog.csdn.net/ChrisLu777/article/details/121177417

版权

本篇为JVM专栏第六篇，讲解内存模型与线程相关知识。上篇是字节码，还没看的可以补补课哈。

点击跳转

Java内存模型

主内存与工作内存

Java内存模型规定了所有的变量都存储在主内存，也叫main memory。除此之外，每条线程有自己的工作内存。线程的工作内存中保存了被该线程使用的变量的主内存副本，线程对变量的所有操作都必须在工作内存中进行，而不能直接读写主内存中的数据。不同的线程之间也无法直接访问对方工作内存中的变量，线程间变量值的传递均需要通过主内存来完成。

线程、主内存、工作内存三者的交互关系如下图所示。

内存间交互操作

内存模型中定义了以下8种操作来完成交互

lock(锁定)：作用于主内存的变量，它把一个变量标识为一条线程独占的状态。
unlock(解锁)：作用于主内存的变量，它把一个处于锁定状态的变量释放出来，释放后的变量才可以被其他线程锁定。
read(读取)：作用于主内存的变量，它把一个变量的值从主内存传输到线程的工作内存中，以便随后的load动作使用。
load(载入)：作用于工作内存的变量，它把read操作从主内存中得到的变量值放入工作内存的变量副本中。
use(使用)：作用于工作内存的变量，它把工作内存中一个变量的值传递给执行引擎，每当虚拟机遇到一个需要使用变量的值的字节码指令时将会执行这个操作。
assign(赋值)：作用于工作内存的变量，它把一个从执行引擎接收的值赋给工作内存的变量，每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
store(存储)：作用于工作内存的变量，它把工作内存中一个变量的值传送到主内存中，以便随后的write操作使用。
write(写入)：作用于主内存的变量，它把store操作从工作内存中得到的变量的值放入主内存的变量中。

如果要把一个变量从主内存拷贝到工作内存，那就要按顺序执行read和load操作。如果要把变量从工作内存同步回主内存，就要按顺序执行store和write操作。

内存模型还规定了在执行上述8种基本操作时必须满足如下规则：

不允许一个变量从主内存读取了但工作内存不接受，或者工作内存发起回写了但主内存不接受的情况出现。
变量在工作内存中改变了之后必须把该变化同步回主内存。
不允许一个线程无原因地把数据从线程的工作内存同步回主内存中。
对一个变量实施use、store操作之前，必须先执行assign和load操作。
一个变量在同一个时刻只允许一条线程对其进行lock操作，但lock操作可以被同一条线程重复执行多次，多次执行lock后，只有执行相同次数的unlock操作，变量才会被解锁。
如果对一个变量执行lock操作，那将会清空工作内存中此变量的值，在执行引擎使用这个变量前，需要重新执行load或assign操作以初始化变量的值。
如果一个变量事先没有被lock操作锁定，那就不允许对它执行unlock操作，也不允许去unlock一个被其他线程锁定的变量。
对一个变量执行unlock操作之前，必须先把此变量同步回主内存中

volatile型变量

关键字volatile是Java虚拟机提供的最轻量级的同步机制。当一个变量被定义成volatile之后，它具备两项特性：第一个就是保证此变量对所有线程的可见性，也就是说当一条线程修改了这个变量的值，其他线程可以立即获得它的新值；第二个就是禁止指令重排序优化。

保证变量对所有线程的可见性举例

先看一段代码，假如线程1先执行，线程2后执行：

~~~java //线程1 boolean stop =false; while(!stop){ doSomething(); }

//线程2 stop =true; ~~~

在有的时候，是无法终断线程1的。线程1在运行的时候，会将stop变量的值拷贝一份放在自己的工作内存当中。当线程2更改了stop变量的值之后，但是还没来得及写入主存当中，线程2转去做其他事情了，那么线程1由于不知道线程2对stop变量的更改，因此还会一直循环下去。

如果用volatile修饰之后就变得不一样了

1、使用volatile关键字会强制将修改的值立即写入主存；

2、使用volatile关键字的话，当线程2进行修改时，会导致线程1的工作内存中缓存变量stop的缓存行无效(反映到硬件层的话，就是CPU的L1或者L2缓存中对应的缓存行无效)；

3、由于线程1的工作内存中缓存变量stop的缓存行无效，所以线程1再次读取变量stop的值时会去主存读取。

　那么在线程2修改stop值时会使得线程1的工作内存中缓存变量stop的缓存行无效，然后线程1读取时，发现自己的缓存行无效，它会等待缓存行对应的主存地址被更新之后，然后去对应的主存读取最新的值，所以线程1读取到的就是最新的正确的值。

但是volatile不能保证对变量操作的原子性

~~~java public class Test { public volatile int inc =0;

public void increase() {
    inc++;
}

public static void main(String[] args) {
    final Test test =new Test();
    for(int i=0;i<10;i++){
        new Thread(){
            public void run() {
                for(int j=0;j<1000;j++)
                    test.increase();
            };
        }.start();
    }

    while(Thread.activeCount()>1) //保证前面的线程都执行完
        Thread.yield();
    System.out.println(test.inc);
}

} ~~~

运行上面的代码，我们的预估应该是10000，但是会发现每次运行结果都不一致，都是一个小于10000的数字。

但是我们已经使用了volatile，然后对变量inc进行自增操作，由于volatile保证了可见性，那么在每个线程中对inc自增完之后，在其他线程中都能看到修改后的值，所以十个线程自增1000次应该是10000。

之所以上面代码用了volatile但还是偏离预估，就是因为volatile无法保证原子性，自增操作是不具备原子性的，它包括读取变量的原始值、进行加1操作、写入工作内存。自增操作的三个子操作可能会分割开执行，可能会导致以下的情况

1、某个时刻变量inc为10，线程1要开始自增操作，去读取inc的原始值，然后线程1阻塞了

2、线程2要开始自增操作，也去读取变量inc的原始值，由于线程1只是对变量inc进行读取操作，而没有对变量进行修改操作，所以不会导致线程2的工作内存中缓存变量inc的缓存行无效，所以线程2会直接去主存读取inc的值，发现inc的值时10，然后进行加1操作，并把11写入工作内存，然后写入主存。

3、紧接着线程1不阻塞了，开始加1，由于已经读取了inc的值，所以此时线程1是对10加1，然后写入主存

以上操作就会导致，两个线程执行了加1操作，但是只加了1。

volatile变量规则是保证修改volatile变量的时候让缓存层无效，其他线程读新的值，但是线程1还没有对inc变量进行修改，所以线程2去主内存读取的是还没修改的值，这一套逻辑是说的通的，但是和预期结果不符了。

所以总结来说，volatile无法保证对变量的任何操作都是原子性，我们应该采取其他方法配合volatile使用，比如synchronized，或者Lock。

禁止指令重排序优化举例

volatile关键字禁止指令重排序有两层意思：

1、当程序执行到volatile变量的读操作或者写操作时，在其前面的操作的更改肯定全部已经进行，且结果已经对后面的操作可见；在其后面的操作肯定还没有进行；

2、在进行指令优化时，不能将在对volatile变量访问的语句放在其后面执行，也不能把volatile变量后面的语句放到其前面执行。

举个简单的例子：

~~~java //x、y为非volatile变量 //flag为volatile变量

x = 2; //语句1 y = 0; //语句2 flag = true; //语句3 x = 4; //语句4 y = -1; //语句5 ~~~

由于flag变量为volatile变量，那么在进行指令重排序的过程的时候，不会将语句3放到语句1、语句2前面，也不会讲语句3放到语句4、语句5后面。但是要注意语句1和语句2的顺序、语句4和语句5的顺序是不作任何保证的。并且volatile关键字能保证，执行到语句3时，语句1和语句2必定是执行完毕了的，且语句1和语句2的执行结果对语句3、语句4、语句5是可见的。

再看一个例子：

~~~java //线程1: context = loadContext(); //语句1 inited =true; //语句2

//线程2: while(!inited ){ sleep() } doSomethingwithconfig(context); ~~~

有可能语句2会在语句1之前执行，那么就可能导致context还没被初始化，而线程2中就使用未初始化的context去进行操作，导致程序出错。这里如果用volatile关键字对inited变量进行修饰，就不会出现这种问题了，因为当执行到语句2时，必定能保证context已经初始化完毕。

原理和实现机制

观察加入volatile关键字和没有加入volatile关键字时所生成的汇编代码发现，加入volatile关键字时，会多出一个lock前缀指令

lock前缀指令实际上相当于一个内存屏障，内存屏障会提供3个功能：

1、它确保指令重排序时不会把其后面的指令排到内存屏障之前的位置，也不会把前面的指令排到内存屏障的后面；即在执行到内存屏障这句指令时，在它前面的操作已经全部完成；

2、它会强制将对缓存的修改操作立即写入主存；

3、如果是写操作，它会导致其他CPU中对应的缓存行无效。

针对long和double型变量的特殊规则

Java内存模型要求lock、unlock、read、load、assign、use、store、write这八种操作都具有原子性，但是对于64位的数据类型在模型中特别定义了一条宽松的规定:允许虚拟机将没有被volatile修饰的64位数据的读写操作划分为两次32位的操作来进行，意思就是允许虚拟机实现自行选择是否要保证64位数据类型的load、store、read和write这四个操作的原子性，这就是所谓的“long和double的非原子性协定”

如果有多个线程共享一个并未声明为volatile的long或double类型的变量，并且同时对它们进行读取和修改操作，那么某些线程可能会读取到一个既不是原值，也不是其他线程修改值的代表了“半个变量”的数值。不过这种读取到“半个变量”的情况是非常罕见的

原子性、可见性、有序性

Java内存模型是围绕着在并发过程中如何处理原子性、可见性和有序性这三个特征来建立的。逐个介绍下是如何实现三个特性的。

原子性

由Java内存模型来直接保证的原子性变量操作包括read、load、assign、use、store和write这六个，我们大致可以认为，基本数据类型的访问、读写都是具备原子性的(例外就是long和double的非原子性协定)

可见性

可见性就是指当一个线程修改了共享变量的值时，其他线程能够立即得知这个修改。Java内存模型是通过在变量修改后将新值同步回主内存，在变量读取前从主内存刷新变量值这种依赖主内存作为传递媒介的方式来实现可见性的，无论是普通变量还是volatile变量都是如此。普通变量与volatile变量的区别是，volatile的特殊规则保证了新值能立即同步到主内存，以及每次使用前立即从主内存刷新。因此我们可以说volatile保证了多线程操作时变量的可见性，而普通变量则不能保证这一点。

除了volatile之外，Java还有两个关键字能实现可见性，它们是synchronized和final。同步块的可见性是由“对一个变量执行unlock操作之前，必须先把此变量同步回主内存中(执行store、write操作)”这条规则获得的。而final关键字的可见性是指被final修饰的字段在构造器中一旦被初始化完成，并且构造器没有把“this”的引用传递出去(this引用逃逸是一件很危险的事情，其他线程有可能通过这个引用访问到“初始化了一半”的对象)，那么在其他线程中就能看见final字段的值。如下面的代码所示，变量i与j都具备可见性，它们无须同步就能被其他线程正确访问。

~~~java public static final int i; public final int j; static { i = 0; // 省略后续动作 } { // 也可以选择在构造函数中初始化 j = 0; // 省略后续动作 } ~~~

有序性

Java程序中天然的有序性可以总结为一句话，如果在本线程内观察，所有的操作都是有序的，如果在一个线程中观察另一个线程，所有的操作都是无序的。

前半句是指线程内似表现为串行的语义，后半句是指“指令重排序”现象和“工作内存与主内存同步延迟”现象。Java语言提供了volatile和synchronized两个关键字来保证线程之间操作的有序性，volatile关键字本身就包含了禁止指令重排序的语义，而synchronized则是由“一个变量在同一个时刻只允许一条线程对其进行lock操作”这条规则获得的，这个规则决定了持有同一个锁的两个同步块只能串行地进入。

先行发生原则

这个原则是判断数据是否存在竞争，线程是否安全的非常有用的手段。依赖这个原则可以通过几条简单规则一揽子解决并发环境下两个操作之间是否可能存在冲突的所有问题。

~~~java // 以下操作在线程A中执行 i = 1; // 以下操作在线程B中执行 j = i; // 以下操作在线程C中执行 i = 2; ~~~

假设线程A中的操作“i=1”先行发生于线程B的操作“j=i”，那我们就可以确定在线程B的操作执行后，变量j的值一定是等于1，得出这个结论的依据有两个：

一是根据先行发生原则，“i=1”的结果可以被观察到；

二是线程C还没登场，线程A操作结束之后没有其他线程会修改变量i的值。

现在再来考虑线程C，我们依然保持线程A和B之间的先行发生关系，而C出现在线程A和B的操作之间，但是C与B没有先行发生关系，j的值此时就不确定是1还是2，因为线程C对变量i的影响可能会被线程B观察到，也可能不会，这时候线程B就存在读取到过期数据的风险，不具备多线程安全性。

Java与线程

线程的实现

实现线程主要有三种方式

使用内核线程实现(1:1实现)
使用用户线程实现(1:N实现)
使用用户线程加轻量级进程混合实现(N:M实现)。

Java线程调度

线程调度是指系统为线程分配处理器使用权的过程，调度主要方式有两种，分别是协同式线程调度和抢占式线程调度。

使用协同式调度的多线程系统，线程的执行时间由线程本身来控制，线程把自己的工作执行完了之后，要主动通知系统切换到另外一个线程上去。协同式多线程的最大好处是实现简单，而且由于线程要把自己的事情干完后才会进行线程切换，切换操作对线程自己是可知的，所以一般没有什么线程同步的问题。

如果使用抢占式调度的多线程系统，那么每个线程将由系统来分配执行时间，线程的切换不由线程本身来决定。

状态转换

Java定义了6种线程状态，在任意一个时间点中，一个线程只能有且只有其中的一种状态，并且可以通过特定的方法在不同状态之间转换。

新建(New)

创建后尚未启动的线程处于这种状态。
运行(Runnable)

包括操作系统线程状态中的Running和Ready，也就是处于此状态的线程有可能正在执行，也有可能正在等待着操作系统为它分配执行时间。
无限期等待(Waiting)

处于这种状态的线程不会被分配处理器执行时间，它们要等待被其他线程显式唤醒。
限期等待(TimedWaiting)

处于这种状态的线程也不会被分配处理器执行时间，不过无须等待被其他线程显式唤醒，在一定时间之后它们会由系统自动唤醒。
阻塞(Blocked)

线程被阻塞了，“阻塞状态”与“等待状态”的区别是“阻塞状态”在等待着获取到一个排它锁，这个事件将在另外一个线程放弃这个锁的时候发生;而“等待状态”则是在等待一段时间，或者唤醒动作的发生。在程序等待进入同步区域的时候，线程将进入这种状态。
结束(Terminated)

已终止线程的线程状态，线程已经结束执行。

线程状态转换如下图所示

JaneRoad

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《深入理解Java虚拟机》读书笔记----Java内存模型与线程

本篇为JVM专栏第六篇，讲解内存模型与线程相关知识。上篇是字节码，还没看的可以补补课哈。点击跳转Java内存模型主内存与工作内存Java内存模型规定了所有的变量都存储在主内存，也叫main memory。除此之外，每条线程有自己的工作内存。线程的工作内存中保存了被该线程使用的变量的主内存副本，线程对变量的所有操作都必须在工作内存中进行，而不能直接读写主内存中的数据。...
复制链接

扫一扫