互斥锁解决并发原子性问题

最新推荐文章于 2024-05-07 06:45:00 发布

海陆云

最新推荐文章于 2024-05-07 06:45:00 发布

阅读量2.2w

点赞数 1

分类专栏： Java并发编程文章标签：高并发编程 java

本文链接：https://blog.csdn.net/weixin_38333368/article/details/122246918

版权

Java并发编程专栏收录该内容

12 篇文章 1 订阅

订阅专栏

互斥锁解决原子性问题

前言
简易锁模型
改进后的锁模型
Java 语言提供的锁技术：synchronized
用 synchronized 解决 count+=1 问题
锁和受保护资源的关系
总结

前言

一个或者多个操作在 CPU 执行的过程中不被中断的特性，称为“原子性”。理解这个特性有助于分析并发编程 Bug 出现的原因，例如利用它可以分析出 long 型变量在 32 位机器上读写可能出现的诡异 Bug，明明已经把变量成功写入内存，重新读出来却不是自己写入的。

原子性问题的源头是线程切换，如果能够禁用线程切换就能解决这个问题，而操作系统做线程切换是依赖 CPU 中断的，所以禁止 CPU 发生中断就能够禁止线程切换。

在早期单核 CPU 时代，这个方案的确是可行的，但是并不适合多核场景。以 32 位 CPU 上执行 long 型变量的写操作为例，long 型变量是 64 位，在 32 位 CPU 上执行写操作会被拆分成两次写操作（写高 32 位和写低 32 位，如下图所示）。

在这里插入图片描述

在单核 CPU 场景下，同一时刻只有一个线程执行，禁止 CPU 中断，意味着操作系统不会重新调度线程，也就是禁止了线程切换，获得 CPU 使用权的线程就可以不间断地执行，所以两次写操作一定是：要么都被执行，要么都没有被执行，具有原子性。

但是在多核场景下，同一时刻，有可能有两个线程同时在执行，一个线程执行在 CPU-1 上，一个线程执行在 CPU-2 上，此时禁止 CPU 中断，只能保证 CPU 上的线程连续执行，并不能保证同一时刻只有一个线程执行，如果这两个线程同时写 long 型变量高 32 位的话，那就有可能出现开头提及的诡异 Bug 了。

“同一时刻只有一个线程执行”称之为互斥。如果能够保证对共享变量的修改是互斥的，那么无论是单核 CPU 还是多核 CPU，就都能保证原子性了。

简易锁模型

在这里插入图片描述

把一段需要互斥执行的代码称为临界区。线程在进入临界区之前，首先尝试加锁 lock()，如果成功，则进入临界区，此时称这个线程持有锁；否则呢就等待，直到持有锁的线程解锁；持有锁的线程执行完临界区的代码后，执行解锁 unlock()。

这个过程非常像办公室里高峰期抢占坑位，每个人都是进坑锁门（加锁），出坑开门（解锁），如厕这个事就是临界区。很容易忽视两个非常非常重要的点：锁的是什么？保护的又是什么？

改进后的锁模型

在现实世界里，锁和锁要保护的资源是有对应关系的，比如你用你家的锁保护你家的东西，我用我家的锁保护我家的东西。在并发编程世界里，锁和资源也应该有这个关系，但这个关系在上面的模型中是没有体现的，所以需要完善一下模型。

在这里插入图片描述

首先，要把临界区要保护的资源标注出来，如图中临界区里增加了一个元素：受保护的资源 R；

其次，要保护资源 R 就得为它创建一把锁 LR；

最后，针对这把锁 LR，还需在进出临界区时添上加锁操作和解锁操作。

另外，在锁 LR 和受保护资源之间，特地用一条线做了关联，这个关联关系非常重要。很多并发 Bug 的出现都是因为把它忽略了，然后就出现了类似锁自家门来保护他家资产的事情，这样的 Bug 非常不好诊断，因为潜意识里认为已经正确加锁了。

Java 语言提供的锁技术：synchronized

锁是一种通用的技术方案，Java 语言提供的 synchronized 关键字就是锁的一种实现。synchronized 关键字可以用来修饰方法、修饰代码块：


class X {
  // 修饰非静态方法
  synchronized void foo() {
    // 临界区
  }
  // 修饰静态方法
  synchronized static void bar() {
    // 临界区
  }
  // 修饰代码块
  Object obj = new Object()；
  void baz() {
    synchronized(obj) {
      // 临界区
    }
  }
}

加锁 lock() 和解锁 unlock() 在这两个操作都是有的，只是这两个操作是被 Java 默默加上的，Java 编译器会在 synchronized 修饰的方法或代码块前后自动加上加锁 lock() 和解锁 unlock()，这样做的好处是加锁 lock() 和解锁 unlock() 一定是成对出现的，毕竟忘记解锁 unlock() 可是个致命的 Bug（意味着其他线程只能死等下去了）。

上面的代码只有修饰代码块的时候，锁定了一个 obj 对象，那修饰方法的时候锁定的是什么呢？这个也是 Java 的一条隐式规则：

当修饰静态方法的时候，锁定的是当前类的 Class 对象，在上面的例子中就是 Class X；
当修饰非静态方法的时候，锁定的是当前实例对象 this。

对于上面的例子，synchronized 修饰静态方法相当于:


class X {
  // 修饰静态方法
  synchronized(X.class) static void bar() {
    // 临界区
  }
}

修饰非静态方法，相当于：


class X {
  // 修饰非静态方法
  synchronized(this) void foo() {
    // 临界区
  }
}

用 synchronized 解决 count+=1 问题

count+=1 存在的并发问题，可以用 synchronized 来解决，代码如下所示。SafeCalc 这个类有两个方法：

get() 方法，用来获得 value 的值；
addOne() 方法，用来给 value 加 1，并且 addOne() 方法用 synchronized 修饰。

那么使用的这两个方法有没有并发问题呢？


class SafeCalc {
  long value = 0L;
  long get() {
    return value;
  }
  synchronized void addOne() {
    value += 1;
  }
}

addOne() 方法，首先可以肯定，被 synchronized 修饰后，无论是单核 CPU 还是多核 CPU，只有一个线程能够执行 addOne() 方法，所以一定能保证原子操作，那是否有可见性问题呢？

管程中锁的规则：对一个锁的解锁 Happens-Before 于后续对这个锁的加锁。

管程就是这里的 synchronized，synchronized 修饰的临界区是互斥的，同一时刻只有一个线程执行临界区的代码；而所谓“对一个锁解锁 Happens-Before 后续对这个锁的加锁”，指的是前一个线程的解锁操作对后一个线程的加锁操作可见，综合 Happens-Before 的传递性原则，就能得出前一个线程在临界区修改的共享变量（该操作在解锁之前），对后续进入临界区（该操作在加锁之后）的线程是可见的。

按照这个规则，如果多个线程同时执行 addOne() 方法，可见性是可以保证的，如果有 1000 个线程执行 addOne() 方法，最终结果一定是 value 的值增加了 1000。

执行 addOne() 方法后，value 的值对 get() 方法是不可见的。管程中锁的规则，是只保证后续对这个锁的加锁的可见性，而 get() 方法并没有加锁操作，所以可见性没法保证。解决方法就是 get() 方法也 synchronized 一下，完整的代码如下所示。


class SafeCalc {
  long value = 0L;
  synchronized long get() {
    return value;
  }
  synchronized void addOne() {
    value += 1;
  }
}

上面的代码转换为锁模型，就是下面图示。get() 方法和 addOne() 方法都需要访问 value 这个受保护的资源，这个资源用 this 这把锁来保护。线程要进入临界区 get() 和 addOne()，必须先获得 this 这把锁，这样 get() 和 addOne() 也是互斥的。

在这里插入图片描述

这个模型更像现实世界里面球赛门票的管理，一个座位只允许一个人使用，这个座位就是“受保护资源”，球场的入口就是 Java 类里的方法，而门票就是用来保护资源的“锁”，Java 里的检票工作是由 synchronized 解决的。

锁和受保护资源的关系

受保护资源和锁之间的关联关系非常重要：受保护资源和锁之间的关联关系是 N:1 的关系。还拿球赛门票的管理来类比，就是一个座位，只能用一张票来保护，如果多发了重复的票，那就要打架了。现实世界里，可以用多把锁来保护同一个资源，但在并发领域是不行的，并发领域的锁和现实世界的锁不是完全匹配的。不过倒是可以用同一把锁来保护多个资源，这个对应到现实世界就是“包场”了。

上面那个例子稍作改动，把 value 改成静态变量，把 addOne() 方法改成静态方法，此时 get() 方法和 addOne() 方法是否存在并发问题呢？


class SafeCalc {
  static long value = 0L;
  synchronized long get() {
    return value;
  }
  synchronized static void addOne() {
    value += 1;
  }
}

改动后的代码是用两个锁保护一个资源。这个受保护的资源就是静态变量 value，两个锁分别是 this 和 SafeCalc.class。由于临界区 get() 和 addOne() 是用两个锁保护的，因此这两个临界区没有互斥关系，临界区 addOne() 对 value 的修改对临界区 get() 也没有可见性保证，这就导致并发问题了。

在这里插入图片描述

总结

互斥锁，在并发领域的知名度极高，只要有了并发问题，首先容易想到的就是加锁，因为加锁能够保证执行临界区代码的互斥性。这样理解虽然正确，但是却不能够指导你真正用好互斥锁。临界区的代码是操作受保护资源的路径，类似于球场的入口，入口一定要检票，也就是要加锁，但不是随便一把锁都能有效。所以必须深入分析锁定的对象和受保护资源的关系，综合考虑受保护资源的访问路径，多方面考量才能用好互斥锁。

synchronized 是 Java 在语言层面提供的互斥原语，其实 Java 里面还有很多其他类型的锁，但作为互斥锁，原理都是相通的：锁，一定有一个要锁定的对象，至于这个锁定的对象要保护的资源以及在哪里加锁 / 解锁，就属于设计层面的事情了。

海陆云

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
互斥锁解决并发原子性问题

互斥锁解决原子性问题前言简易锁模型改进后的锁模型Java 语言提供的锁技术：synchronized用 synchronized 解决 count+=1 问题锁和受保护资源的关系总结前言一个或者多个操作在 CPU 执行的过程中不被中断的特性，称为“原子性”。理解这个特性有助于分析并发编程 Bug 出现的原因，例如利用它可以分析出 long 型变量在 32 位机器上读写可能出现的诡异 Bug，明明已经把变量成功写入内存，重新读出来却不是自己写入的。原子性问题的源头是线程切换，如果能够禁用线程切换就能
复制链接

扫一扫