Java并发学习笔记（二）：synchronized使用、synchronized原理、Monitor管程、轻量级锁、自旋优化、偏向锁、锁消除

最新推荐文章于 2023-04-11 16:57:04 发布

Miracle42

最新推荐文章于 2023-04-11 16:57:04 发布

阅读量1.4k

点赞数 1

分类专栏：后端并发文章标签：多线程 java

本文链接：https://blog.csdn.net/han_zhuang/article/details/106411984

版权

后端同时被 2 个专栏收录

62 篇文章 5 订阅

订阅专栏

并发

10 篇文章 1 订阅

订阅专栏

共享模型之管程

一、引入

看看下面的例子，两个线程对初始值为 0 的静态变量一个做自增，一个做自减，各做 5000 次，结果是 0 吗？

    static int counter = 0;

    public static void main(String[] args) throws InterruptedException {
        Thread t1 = new Thread(new Runnable() {
            public void run() {
                for (int i = 0; i < 5000; i++){
                    counter++;
                }
            }
        }, "t1");

        Thread t2 = new Thread(new Runnable() {
            public void run() {
                for (int i = 0; i < 5000; i++){
                    counter--;
                }
            }
        }, "t2");

        t1.start();
        t2.start();
        t1.join();
        t2.join();

        System.out.println("counter = " + counter);
    }

可以从下面的图中看出，结果不为零。

在这里插入图片描述

问题分析

以上的结果可能是正数、负数、零。为什么呢？因为 Java 中对静态变量的自增，自减并不是原子操作，要彻底理解，必须从字节码来进行分析：

例如对于i++ 而言（i 为静态变量），实际会产生如下的 JVM 字节码指令：

getstatic     i  // 获取静态变量i的值 
iconst_1         // 准备常量1 
iadd             // 自增 
putstatic     i  // 将修改后的值存入静态变量i

而对应i--也是类似：

getstatic     i  // 获取静态变量i的值 
iconst_1         // 准备常量1 
isub             // 自减 
putstatic     i  // 将修改后的值存入静态变量i

而 Java 的内存模型如下，完成静态变量的自增，自减需要在主存和工作内存中进行数据交换：

在这里插入图片描述

在多线程下这 8 行代码可能交错运行，如下图所示：
在这里插入图片描述
这样就会导致结果出现-1。

临界区 Critical Section

一个程序运行多个线程本身是没有问题的
问题出在多个线程访问共享资源
- 多个线程读取共享资源也不会产生问题
- 但是在多个线程对共享资源读写操作时发生指令交错，就会出现问题
一段代码块如果出现对共享资源的多线程读写操作，这个代码块称为临界区

例如，下面代码中的临界区

static int counter = 0;
 
static void increment() 
// 临界区 
{        
	counter++; 
}
 
static void decrement() 
// 临界区 
{        
	counter--; 
}

竞态条件 Race Condition

多个线程在临界区内执行，由于代码的执行序列不同而导致结果无法预测，称之为发生了竞态条件

避免临界区的竞态条件发生的手段有：

阻塞式的解决方案：Synchronized、lock
非阻塞式的解决方法：原子变量

二、synchronized用在代码块上

参考

Synchronized俗称【对象锁】，它采用互斥的方式让同一时刻至多只有一个线程能持有【对象锁】，其他线程想要再获取这个对象锁时就会阻塞。这样就保证了拥有锁的线程可以安全的执行临界区中的代码，不用担心上下文切换。

注意：虽然Java中互斥和同步都是使用Synchronized关键字来实现的，但是他们还是有区别的

互斥是保证临界区的竞态条件发生时，同一时刻只能有一个线程执行临界区的代码
同步是指由于多个线程的执行先后顺序不同，需要一个线程等待其他线程运行到某个点上

语法:

synchronized(对象){ // 线程1， 线程2(blocked) 
	//临界区
}

将上面的代码使用Synchronized实现互斥

    static int counter = 0;
    static final Object lock = new Object();

    public static void main(String[] args) throws InterruptedException {
        Thread t1 = new Thread(new Runnable() {
            public void run() {
                for (int i = 0; i < 5000; i++){
                    synchronized(lock){
                        counter++;
                    }
                }
            }
        }, "t1");

        Thread t2 = new Thread(new Runnable() {
            public void run() {
                for (int i = 0; i < 5000; i++){
                    synchronized(lock){
                        counter--;
                    }
                }
            }
        }, "t2");

        t1.start();
        t2.start();
        t1.join();
        t2.join();

        System.out.println("counter = " + counter);
    }

下面使用时序图来展示加锁之后，上面代码的工作流程：

在这里插入图片描述

从上面的分析可以看出，synchronized实际是用对象锁保证了临界区内代码的原子性，使得临界区内的代码变成了不可分割的，不会被线程切换所打断。

请思考下面的问题：

如果把 synchronized(obj) 放在 for 循环的外面，如何理解？
- 会对整个for循环进行加锁，只有当t2的for循环执行完成之后，t1才会继续执行
如果 t1 synchronized(obj1) 而 t2 synchronized(obj2) 会怎样运作？
- 两个线程使用了不同的对象锁，仍然会出现被打断的现象
如果 t1 synchronized(obj) 而 t2 没有加会怎么样？如何理解？
- 和上面的问题类型，t1虽然能获得对象锁，但是t2执行时不会检测是否已经加锁，仍然会出现大段的现象

面向对象改进：实现线程安全的对象

public class AutoIncreaseTest {

    public static void main(String[] args) throws InterruptedException {
        Room room = new Room();

        Thread t1 = new Thread(new Runnable() {
            public void run() {
                for (int i = 0; i < 5000; i++){
                    room.incr();
                }
            }
        }, "t1");

        Thread t2 = new Thread(new Runnable() {
            public void run() {
                for (int i = 0; i < 5000; i++){
                    room.decr();
                }
            }
        }, "t2");

        t1.start();
        t2.start();
        t1.join();
        t2.join();

        System.out.println("counter = " + room.getCounter());
    }

}

/**
 * 实现线程安全的自增自减类
 */
class Room{
    private int counter = 0;

    public void incr(){
        synchronized(this){ //使用当前对象对自增进行加锁
            counter++;
        }
    }

    public void decr(){
        synchronized (this){//使用当前对象对自减进行加锁
            counter--;
        }
    }

    public int getCounter(){
        synchronized (this){//使用当前对象对获取值进行加锁
            return counter;
        }
    }
}

三、synchronized用在方法上

synchronized除了可以用在代码块上，还可以用在普通同步方法（实例方法），锁是当前实例对象，进入同步代码前要获得当前实例的锁

class Test{    
    public synchronized void test() {  
    	
    } 
} 
等价于 
class Test{    
    public void test() {        
        synchronized(this) {      
        
        }    
    } 
}

同时也可以锁静态同步方法，锁是当前类的class对象，进入同步代码前要获得当前类对象的锁

class Test{    
    public synchronized static void test() {  
    	
    } 
} 
等价于 
class Test{    
    public static void test() {        
        synchronized(Test.class) {      
        
        }    
    } 
}

四、变量的线程安全分析

1、成员变量和静态变量是否线程安全？

如果它们没有共享，则线程安全
如果它们被共享了，根据它们的状态是否能够改变，又分两种情况
- 如果只有读操作，则线程安全
- 如果有读写操作，则这段代码是临界区，需要考虑线程安全

查下面的代码，向一个成员变量ArrayList中添加和删除元素，单线程时不会出现任何问题，但是多线程的情况下可能会出现删除空的ArrayList从而引发异常（如下图所示）：


    ArrayList<String> list = new ArrayList<>();

    static final int THREAD_NUMBER = 2;
    static final int LOOP_NUMBER = 200;

    public static void main(String[] args) {
        ThreadUnsafe test = new ThreadUnsafe();
        for (int i = 0; i < THREAD_NUMBER; i++) {
            new Thread(() -> {
                test.method1(LOOP_NUMBER);
            }, "Thread" + i).start();
        }
    }

    public void method1(int loopNumber) {
        for (int i = 0; i < loopNumber; i++) {
            //  临界区, 会产生竞态条件
            method2();
            method3();
            // 临界区
        }
    }

    private void method2() {
        list.add("1");
    }

    private void method3() {
        list.remove(0);
    }

那为什么会这样呢？因为无论哪个线程中的 method2或者method3都引用的都是同一个对象中的 list 成员变量，如下图所示：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BdMn8uLG-1590666361668)(C:\Users\韩壮\AppData\Roaming\Typora\typora-user-images\image-20200527184004424.png)]

2、局部变量是否线程安全？

局部变量是线程安全的
但局部变量引用的对象则未必
- 如果该对象没有逃离方法的作用访问，它是线程安全的
- 如果该对象逃离方法的作用范围，需要考虑线程安全

对于下面的代码：虽然也有i++操作，但是在多线程操作下却是安全的，因为其中的i是局部变量

    public static void test1() {
        int i = 10;
        i++;
    }

下面从字节码和JVM的角度分析为什么局部变量在多线程是安全的，上面的这段代码字节码为：

 0: bipush        10         
 2: istore_0         
 3: iinc          0, 1         
 6: return

自增操作使用iinc一条指令就完成了，而且每个线程的i都存储在线程私有的栈桢中，多线程是不共享的，如下图所示：

在这里插入图片描述

五、常见线程安全类

当多个线程访问某个类时，不管运行时环境采用何种调度方式或者这些线程将如何交替执行，并且在主调代码中不需要任何额外的同步和协同，这个类都能表现出正确的行为，那么就可以说这个类是线程安全的

常见线程安全类包括：

String
Integer
StringBuﬀer
Random
Vector
Hashtable
java.util.concurrent 包下的类，如ConcurrentHashMap

这里说它们是线程安全的是指，多个线程调用它们同一个实例的某个方法时，是线程安全的。也可以理解为

它们的每个方法都是原子的，synchronized修饰的
但它们多个方法的组合不是原子的

也就是说多线程运行下面的代码是安全的：

Hashtable table = new Hashtable();

new Thread(() -> {
	table.put("key", "value1");
}).start();

new Thread(() -> {
	table.put("key", "value2");
}).start();

但是下面代码就不是线程安全的，因为虽然put和get方法中代码执行是原子的，但是这两个方法之间可能发生线程的下文的切换，从而导致执行发生不正确的结果，如下图所示：

Hashtable table = new Hashtable(); 
// 线程1，线程2 
if( table.get("key") == null) {    
	table.put("key", value); 
}

在这里插入图片描述
不可变类线程安全性：String、Integer 等都是不可变类，因为其内部的状态不可以改变，因此它们的方法都是线程安全的。

六、Monitor概念

1、Java 对象头

对象头中的内容（以 32 位虚拟机为例），共8个字节，4字节存储Mark Word，另外4个字节存储类对象的位置：

在这里插入图片描述

而数组多了一部分用于存储数组长度：

在这里插入图片描述

其中 Mark Word 结构如下图所示，在不同的状态下 Mark Word 中存储的内容不同。正常情况下（normal）存储了hashcode，还有垃圾回收的年龄age，biased_lock，以及当前的状态（01）。加锁（重量级）状态下（Heavyweight Locked）存储了指向的monitor的地址（ptr_to_heavyweight_monitor）还有当前的状态（10）。

在这里插入图片描述

2、Monitor（锁）

Monitor被翻译为监视器或者管程

每个java对象都可以关联一个Monitor对象，如果使用synchronized给对象上锁（重量级）之后，该对象的Mark Word就会被设为指向monitor对象的指针。monitor的结构如下图所示：
在这里插入图片描述
使用Monitor给对象上锁（重量级锁）的过程（如下图所示）：

刚才是Monitor的Owner为null
当Thread-2执行synchronized(obj) 就会将monitor的所有者Owner更改为Thread-2，monitor只能有一个所有者Owner
在Thread-2上锁的过程中，如果Thread-3、Thread-4、Thread-5也来执行执行synchronized(obj) ，就进入EntryList处于阻塞状态（BLOCKED）
当Thread-2执行完同步代码块中的内容，就会唤醒EntryList处于阻塞状态的线程来竞争锁，竞争时是非公平的
其中WaitSet中的线程是获得过锁，但是进入WAIT状态的

在这里插入图片描述

注意：

synchronized必须进入同一个对象的monitor才会有上述过程，不同的锁对象拥有不同的monitor
不加synchronized锁的对象不会管理monitor监视器，不会遵循上述规则

七、synchronized 原理

1、基本原理

先看下面的代码：

    static final Object lock = new Object();
    static int counter = 0;

    public static void main(String[] args) {
        synchronized (lock) {
            counter++;
        }
    }

对上面的代码它的字节码为：

 0: getstatic     #2                  // <- lock引用 （synchronized开始）         
 3: dup         
 4: astore_1                          // lock引用 -> slot 1         
 5: monitorenter                      // 将 lock对象 MarkWord 置为 Monitor 指针         
 6: getstatic     #3                  // <- i         
 9: iconst_1                          // 准备常数 1        
 10: iadd                              // +1        
 11: putstatic     #3                  // -> i        
 14: aload_1                           // <- lock引用        
 15: monitorexit                       // 将 lock对象 MarkWord 重置, 唤醒 EntryList     
 16: goto          24        
 19: astore_2                          // e -> slot 2         
 20: aload_1                           // <- lock引用        
 21: monitorexit                       // 将 lock对象 MarkWord 重置, 唤醒 EntryList     
 22: aload_2                           // <- slot 2 (e)        
 23: athrow                            // throw e        
 24: return      
 Exception table:         
 from    to  target type             
 6    16    19   any            
 19    22    19   any

从字节码的第5行可以看出，在临界区进入临界区的时候使用monitorenter指令将 lock对象 MarkWord 置为 Monitor 指针。

而临界区结束之后使用了monitorexit将 lock对象 MarkWord 重置, 唤醒 EntryList。

为了防止6~16行出现异常时无法释放锁，异常处理中第21行也是用monitorexit对锁进行了释放。

注意：方法级别的 synchronized 不会在字节码指令中有所体现

2、轻量级锁

轻量级锁的使用场景：如果一个对象虽然有多线程要对其加锁，但加锁的时间是错开的（也就是没有竞争），那么可以使用轻量级锁来优化

注意：轻量级锁对于开发者是透明的，即语法仍然是 synchronized

假设有两个方法同步块，利用同一个对象加锁，

    static final Object obj = new Object();

    public static void method1() {
        synchronized (obj) {        
            // 同步块 A        
            method2();
        }
    }

    public static void method2() {
        synchronized (obj) {        
            // 同步块 B    
        }
    }

它们使用的轻量级锁的流程如下面分析所示：

创建锁记录（Lock Record）对像，每个线程的栈桢中都包含一个锁记录结构，内部可以存储锁定对的Mark Word，和锁对象的引用

在这里插入图片描述

让锁记录中 Object reference 指向锁对象，并尝试使用cas替换 Object 的 Mark Word，将 Mark Word （Normal状态）存入锁记录中。
如果 cas 替换成功，对象头中存储了 锁记录地址和状态 00 ，表示由该线程给对象加锁，这时图示如下

在这里插入图片描述

有两种情况会发生 cas 失败：
- 如果其他线程已经持有该对象的轻量级锁，这时表明有竞争，会进入锁膨胀过程（下面会讲）
- 如果是自己执行了synchronized 导致锁重入（如上面method2方法所示），那么会再添加一条lock record作为重入的计数，其中内容为null

在这里插入图片描述

当退出synchronized 代码块（解锁时），如果有取值为null的锁记录，表示有重入，这时删除该条锁记录，表示重入指减一

在这里插入图片描述

当退出 synchronized 代码块（解锁时）锁记录的值不为 null，这时使用cas将Mark Word的值恢复给对象头
- 成功，则解锁成功
- 失败，说明轻量级锁进行了锁膨胀已经升级为重量级锁，进入重量级锁解锁流程

2）锁膨胀

如果尝试加轻量级锁过程中，CAS无法操作成功，这时就是已经给锁对象上了轻量级锁（有竞争），这时需要进行锁膨胀，将轻量级锁变为重量级锁，步骤如下所示：

    static Object obj = new Object();

    public static void method1() {
        synchronized (obj) {
            // 同步块    
        }
    }

当 Thread-1 进行轻量级加锁时，Thread-0 已经对该对象加了轻量级锁
Thread-1 进行轻量级加锁失败，进入锁膨胀流程
为Object对象申请Monitor锁，让Object指向重量级锁Monitor地址
然后自己进入的 EntryList 进行阻塞BLOCKED

在这里插入图片描述

当Thread-0退出同步块进行解锁时，使用 cas 将 Mark Word 的值恢复给对象头，失败。这时进入重量级锁解锁流程，即按照Monitor地址找到Monitor对象，设置Owner为null，唤醒 EntryList 中 BLOCKED 线程

3、自旋优化

重量级锁竞争的时候，还可以使用自旋来进行优化，如果当前线程自旋成功（即这时候持锁线程已经退出了同步块，释放了锁），这时当前线程就可以避免阻塞。

自旋的出现是因为Thead线程进入EntryList 进行阻塞BLOCKED需要进行上下文切换，会消耗资源。如果自旋几轮之后发现锁已经释放，则可以直接获得锁，不用进入阻塞状态。

自旋重试成功的情况：
在这里插入图片描述
自旋重试失败的情况：

在这里插入图片描述

注意：

自旋会占用 CPU 时间，单核 CPU 自旋就是浪费，多核 CPU 自旋才能发挥优势。
在 Java 6 之后自旋锁是自适应的，比如对象刚刚的一次自旋操作成功过，那么认为这次自旋成功的可能性会高，就多自旋几次；反之，就少自旋甚至不自旋，总之，比较智能。
Java 7 之后不能控制是否开启自旋功能

4、偏向锁

1）简介

引入：轻量级锁在没有竞争时（就自己这个线程），每次重入仍然需要执行 CAS 操作。

Java 6 中引入了偏向锁来做进一步优化：第一次加锁使用CAS将线程ID设置到对象头的Mark Word头，之后重入时发现这个线程ID是自己的就表示没有竞争，不用重新 CAS。以后只要不发生竞争，这个对象就归该线程所有

    public static void m1() {
        synchronized (obj) {
            // 同步块 A   
            m2();
        }
    }

    public static void m2() {
        synchronized (obj) {
            // 同步块 B
            m3();
        }
    }

    public static void m3() {
        synchronized (obj) {
            // 同步块 C
        }
    }

使用轻量级锁的示意图如下图所示：

在这里插入图片描述

使用偏向锁时：
在这里插入图片描述

2）偏向状态

回忆一下对象头格式
在这里插入图片描述
偏向锁的特点：

如果开启了偏向锁（默认开启），那么对象创建后，markword 值为 0x05 即后 3 位为 101，这时它的 thread、epoch、age 都为 0
偏向锁是默认是延迟的，不会在程序启动时立即生效，如果想避免延迟，可以加 VM 参数 -XX:BiasedLockingStartupDelay=0 来禁用延迟
处于偏向锁的对象解锁后，线程 id 仍存储于对象头中
如果没有开启偏向锁，那么对象创建后，markword 值为 0x01 即后 3 位为 001，这时它的 hashcode、 age 都为 0，第一次用到 hashcode 时才会赋值
添加 VM 参数 -XX:-UseBiasedLocking 禁用偏向锁
会发生撤销偏向锁的情况
- 正常状态对象一开始是没有 hashCode 的，第一次调用才生成，hashCode调用之后偏向锁被撤销
  - 轻量级锁会在锁记录中记录 hashCode
  - 重量级锁会在 Monitor 中记录 hashCode
- 当有其它线程使用偏向锁对象时，会将偏向锁升级为轻量级锁
- 调用 wait/notify
批量重偏向：如果对象虽然被多个线程访问，但没有竞争，这时偏向了线程 T1 的对象仍有机会重新偏向 T2，重偏向会重置对象的 Thread ID。当撤销偏向锁阈值超过 20 次后，jvm 会这样觉得，我是不是偏向错了呢，于是会在给这些对象加锁时重新偏向至加锁线程(T2)
批量撤销 : 当撤销偏向锁阈值超过 40 次后，jvm 会这样觉得，自己确实偏向错了，根本就不该偏向。于是整个类的所有对象都会变为不可偏向的，新建的对象也是不可偏向的

5、锁消除

当即时编译器（JIT）对代码进行优化时发现，没必要加锁就会将锁进行消除。使用-XX:-EliminateLocks参数就可以禁止锁消除。对于下面的代码：

@BenchmarkMode(Mode.AverageTime)
@Warmup(iterations = 3)
@Measurement(iterations = 5)
@OutputTimeUnit(TimeUnit.NANOSECONDS)
public class MyBenchmark {
    static int x = 0;

    @Benchmark
    public void a() throws Exception {
        x++;
    }

    @Benchmark
    public void b() throws Exception {
        Object o = new Object();
        synchronized (o) {
            x++;
        }
    }
}