JVM第十五篇（完结篇内存模型）

最新推荐文章于 2024-03-23 11:15:33 发布

红尘不染

最新推荐文章于 2024-03-23 11:15:33 发布

阅读量462

点赞数

分类专栏： JVM 文章标签： java jvm

本文链接：https://blog.csdn.net/weixin_40540957/article/details/121421954

版权

JVM 专栏收录该内容

15 篇文章 1 订阅

订阅专栏

这是目录

JMM（java内存模型）
CAS
synchronized 优化
JVM 完结

JMM（java内存模型）

java 内存模型是 Java Memory Model（JMM）的意思。简单的说，JMM 定义了一套在多线程读写共享数据时（成员变量、数组）时，对数据的可见性、有序性、和原子性的规则和保障。

原子性

原子性：一个或多个操作是不可中断的，要么全部执行，要么全部执行失败。
原子操作：符合原子性的操作。
从一个简单的代码，分析问题

public class Demo4_1 {
    static int i = 0;
    public static void main(String[] args) throws InterruptedException {
        Thread t1 = new Thread(() -> {      
            for (int j = 0; j < 50000; j++) {
                i++;
            }
        });
        Thread t2 = new Thread(() -> {
            for (int j = 0; j < 50000; j++) {
                i--;
            }
        });
        t1.start();
        t2.start();
        t1.join();
        t2.join();
        System.out.println(i);
    }
}

在两个线程中分别对静态变量 i 执行5000次i++和i–操作。然后输出 i 的值，多次执行，发现每次的结果都不一样。
这是因为 i ++ 和 i – 操作不是原子性的操作，两个线程在执行时，会互相干扰，造成结果的错误。
i ++ 对应的字节码指令

getstatic i 	// 获取静态变量i的值
iconst_1 		// 准备常量1
iadd 			// 加法，将1和i值相加
putstatic i 	// 将修改后的值存入静态变量i

i – 对应的字节码指令

getstatic i 	// 获取静态变量i的值
iconst_1 		// 准备常量1
isub 			// 减法
putstatic i 	// 将修改后的值存入静态变量i

这些指令可能在执行时，交替执行。例如

getstatic i 	// 线程1-获取静态变量i的值 线程内i=0
getstatic i 	// 线程2-获取静态变量i的值 线程内i=0
iconst_1 		// 线程1-准备常量1
iadd 			// 线程1-自增 线程内i=1
putstatic i 	// 线程1-将修改后的值存入静态变量i 静态变量i=1
iconst_1 		// 线程2-准备常量1
isub 			// 线程2-自减 线程内i=-1
putstatic i 	// 线程2-将修改后的值存入静态变量i 静态变量i=-1

JMM 中静态变量存放在主内存中，线程执行时，将 i 的值读取到线程的工作内存，完成修改操作后，写回主内存，两个线程并发，对主内存中 i 操作，导致结果出错。
在这里插入图片描述
解决方法
使用 synchronized（同步关键字）解决线程并发时，对同一个变量的操作。
语法：

synchronized(对象){
	要作为原子操作代码
}

在代码中进行修改，使用 synchronized 关键字。将 i++ 和 i–作为原子性操作。

static Object obj = new Object();
for (int j = 0; j < 50000; j++) {
	synchronized(obj){
		i++;
	}
}
for (int j = 0; j < 50000; j++) {
	synchronized(obj){
		i--;
	}
}

当线程 t1 执行到 synchronized(obj) 时就好比 t1 进入了这个房间，并反手锁住了门，在门内执行
i ++ 代码。
这时候如果 t2 也运行到了 synchronized(obj) 时，它发现门被锁住了，只能在门外等待。
当 t1 执行完 synchronized{} 块内的代码，这时候才会解开门上的锁，从 obj 房间出来。t2 线程这时才
可以进入 obj 房间，反锁住门，执行它的 i – 代码

可见性

一个线程对对象的操作，可以被其它线程知道，称为可见性。

static boolean run = true;
public static void main(String[] args) throws InterruptedException {
	Thread t = new Thread(()->{
		while(run){
			// ....
		}
	});
	t.start();
	Thread.sleep(1000);
	run = false; 	// 修改run，使得线程t中while循环停下，但是线程t不会如预想的停下来
}

原因分析：

初始状态， t 线程刚开始从主内存读取了 run 的值到工作内存。
. 因为 t 线程要频繁从主内存中读取 run 的值，JIT 编译器会将 run 的值缓存至自己工作内存中的高速缓存中，减少对主存中 run 的访问，提高效率。
1 秒之后，main 线程修改了 run 的值，并同步至主存，而 t 是从自己工作内存中的高速缓存中读
取这个变量的值，结果永远是旧值。
解决方法
使用 volatile（易变关键字）修饰变量 run
它可以用来修饰成员变量和静态成员变量，他可以避免线程从自己的工作缓存中查找变量的值，必须到主存中获取它的值，线程操作 volatile 变量都是直接操作主存

volatile实现可见性：
1）该变量立即刷新到主内存。
2）使其他线程的共享变量立即失效。言外之意当其他线程需要的时候再从主内存取。

volatile 只保证可见性，属于轻量级操作，性能相对更高。
synchronized 语句块既可以保证代码块的原子性，也同时保证代码块内变量的可见性。但缺点是
synchronized是属于重量级操作，性能相对更低。

有序性

诡异的结果

int num = 0;
boolean ready = false;
// 线程1 执行此方法
public void actor1(I_Result r) {
	if(ready) {
		r.r1 = num + num;
	} else {
		r.r1 = 1;
	}
} 
// 线程2 执行此方法
public void actor2(I_Result r) {
	num = 2;
	ready = true;
}

分析执行完成之后，r.r1 的值的可能。

情况1：线程1 先执行，这时 ready = false，所以进入 else 分支结果为 1
情况2：线程2 先执行 num = 2，但没来得及执行 ready = true，线程1 执行，还是进入 else 分支，结果为1
情况3：线程2 执行到 ready = true，线程1 执行，这回进入 if 分支，结果为 4（因为 num 已经执行过了）
情况4：线程2 执行 ready = true，切换到线程1，进入 if 分支，相加为 0，再切回线程2 执行 num = 2

在情况4中先执行了ready = true，然后执行 num = 2，这种现象叫做指令重排，是 JIT 编译器在运行时的一些优化，这个现象需要通过大量测试才能复现：借助 java 并发压测工具 jcstress，测试。
测试结果如下，0的情况出现了 1652 次，虽然少，但是存在这种现象。

0 1,652 ACCEPTABLE_INTERESTING !!!!
1 46,460,657 ACCEPTABLE ok
4 4,571,072 ACCEPTABLE ok

解决方法
volatile 修饰的变量，可以禁用指令重排。

有序性理解
JVM 会在不影响正确性的前提下，可以调整语句的执行顺序。

static int i;
static int j;
// 在某个线程内执行如下赋值操作
i = ...; // 较为耗时的操作
j = ...;

可以看到，至于是先执行 i 还是先执行 j ，对最终的结果不会产生影响。所以，上面代码真正执行
时，既可以是

i = ...; // 较为耗时的操作
j = ...;

也可以是

j = ...;
i = ...; // 较为耗时的操作

这种特性称之为『指令重排』，但是在多线程下『指令重排』会影响正确性。例如著名的double-checked locking 模式实现单例。

public final class Singleton {
	private Singleton() { }
	private static Singleton INSTANCE = null;
	public static Singleton getInstance() {
		// 实例没创建，才会进入内部的 synchronized代码块
		if (INSTANCE == null) {
			synchronized (Singleton.class) {
				// 也许有其它线程已经创建实例，所以再判断一次
				if (INSTANCE == null) {
					INSTANCE = new Singleton();
				}
			}
		} 
		return INSTANCE;
	}
}

以上的实现特点是：
1. 懒惰实例化
2. 首次使用 getInstance() 才使用 synchronized 加锁，后续使用时无需加锁

但在多线程环境下，上面的代码是有问题的， INSTANCE = new Singleton() 对应的字节码为：

0: new #2 				// class cn/itcast/jvm/t4/Singleton
3: dup					
4: invokespecial #3 	// Method "<init>":()V
7: putstatic #4 		// Field

在执行 new Singleton 的时候，如果 4，7发生指令重排，现执行 7 ，再执行 4。
对应于两个线程 t1 和 t2，t1线程在创建对象时，先执行7，同时 t2线程判断 INSTANCE 不为空，拿到INSTANCE ，但是此时 t1中的 4还未执行，也就是说， INSTANCE 还未执行构造方法，t2 线程拿到的 INSTANCE 是一个未构造完成的对象。此时，使用 INSTANCE 就会发生错误。

对 INSTANCE 使用 volatile 修饰即可，可以禁用指令重排。

happens-before

happens-before 规定了哪些写操作对其它线程的读操作可见，它是可见性与有序性的一套规则总结，
抛开以下 happens-before 规则，JMM 并不能保证一个线程对共享变量的写，对于其它线程对该共享变量的读可见。

1.线程解锁 m 之前对变量的写，对于接下来对 m 加锁的其它线程对该变量的读可见
即，synchronized 保证了可见性。
在 t1 中修改了 x的值，在t2中可见。

static int x;
static Object m = new Object();
new Thread(()->{
	synchronized(m) {
		x = 10;
	}
},"t1").start();
new Thread(()->{
	synchronized(m) {
		System.out.println(x);
	}
},"t2").start();

2.线程对 volatile 变量的写，对接下来其它线程对该变量的读可见

volatile static int x;
new Thread(()->{
	x = 10;
},"t1").start();
new Thread(()->{
	System.out.println(x);
},"t2").start();

3.线程 start 前对变量的写，对该线程开始后对该变量的读可见

static int x;
x = 10;
new Thread(()->{
	System.out.println(x);
},"t2").start();

4.线程结束前对变量的写，对其它线程得知它结束后的读可见（比如其它线程调用 t1.isAlive() 或
t1.join()等待它结束）

static int x;
Thread t1 = new Thread(()->{
	x = 10;
},"t1");
t1.start();
t1.join();
System.out.println(x);

5.线程 t1 打断 t2（interrupt）前对变量的写，对于其他线程得知 t2 被打断后对变量的读可见（通
过t2.interrupted 或 t2.isInterrupted）

static int x;
public static void main(String[] args) {
	Thread t2 = new Thread(()->{
		while(true) {
			if(Thread.currentThread().isInterrupted()) {
				System.out.println(x);
				break;
			}
		}
	},"t2");
	t2.start();
	new Thread(()->{
		try {
			Thread.sleep(1000);
		} catch (InterruptedException e) {
			e.printStackTrace();
		} 
		x = 10;
		t2.interrupt();
	},"t1").start();
	while(!t2.isInterrupted()) {
		Thread.yield();
	} 
	System.out.println(x);
}

对变量默认值（0，false，null）的写，对其它线程对该变量的读可见
具有传递性，如果 x hb-> y 并且 y hb-> z 那么有 x hb-> z

CAS

CAS 即 Compare and Swap ，它体现的一种乐观锁的思想。

CAS底层原理

一个例子：比如多个线程要对一个共享的整型变量执行 +1 操作

// 需要不断尝试
while(true) {
	int 旧值 = 共享变量 ; // 比如拿到了当前值 0
	int 结果 = 旧值 + 1; // 在旧值 0 的基础上增加 1 ，正确结果是 1
	/*
	这时候如果别的线程把共享变量改成了 5，本线程的正确结果 1 就作废了，这时候
	compareAndSwap 返回 false，重新尝试，直到：true
	compareAndSwap 返回 true，表示我本线程做修改的同时，别的线程没有干扰
	*/
	if( compareAndSwap ( 旧值, 结果 )) {
		// 成功，退出循环
	}
}

获取共享变量时，为了保证该变量的可见性，需要使用 volatile 修饰。结合 CAS 和 volatile 可以实现无锁并发，适用于竞争不激烈、多核 CPU 的场景下。

因为没有使用 synchronized，所以线程不会陷入阻塞，这是效率提升的因素之一
如果竞争激烈，可以想到重试必然频繁发生，反而效率会受影响

CAS 底层依赖于一个 Unsafe 类来直接调用操作系统底层的 CAS 指令，下面是直接使用 Unsafe 对象进行线程安全保护的一个例子

class DataContainer {
	private volatile int data;
	static final Unsafe unsafe;
	static final long DATA_OFFSET;
	static {
		try {
			// Unsafe 对象不能直接调用，只能通过反射获得
			Field theUnsafe = Unsafe.class.getDeclaredField("theUnsafe");
			theUnsafe.setAccessible(true);
			// 获取 unsafe 对象
			unsafe = (Unsafe) theUnsafe.get(null);
		} catch (NoSuchFieldException | IllegalAccessException e) {
			throw new Error(e);
		} try {
			// data 属性在 DataContainer 对象中的偏移量，用于 Unsafe 直接访问该属性
			DATA_OFFSET = unsafe.objectFieldOffset(DataContainer.class.getDeclaredField("data"));
		} catch (NoSuchFieldException e) {
			throw new Error(e);
		}
	} 
	// 使用 unsafe 加操作
	public void increase() {
		int oldValue;
		while(true) {
			// 获取共享变量旧值，可以在这一行加入断点，修改 data 调试来加深理解
			oldValue = data;
			// cas 尝试修改 data 为 旧值 + 1，如果期间旧值被别的线程改了，返回 false
			if (unsafe.compareAndSwapInt(this, DATA_OFFSET, oldValue, oldValue + 1)) {
				return;
			}
		}
	} 
	// 使用 unsafe 减操作
	public void decrease() {
		int oldValue;
		while(true) {
			oldValue = data;
			if (unsafe.compareAndSwapInt(this, DATA_OFFSET, oldValue, oldValue - 1)) {
				return;
			}
		}
	}
	public int getData() {
		return data;
	}
}

调用类

import sun.misc.Unsafe;
import java.lang.reflect.Field;
public class TestCAS {
	public static void main(String[] args) throws InterruptedException {
		DataContainer dc = new DataContainer();
		int count = 5;Thread t1 = new Thread(() -> {
			for (int i = 0; i < count; i++) {
				dc.increase();
			}	
		});
		t1.start();
		t1.join();
		System.out.println(dc.getData());
	}
}

乐观锁与悲观锁：

CAS 是基于乐观锁的思想：最乐观的估计，不怕别的线程来修改共享变量，就算改了也没关系，
我吃亏点再重试呗。
synchronized 是基于悲观锁的思想：最悲观的估计，得防着其它线程来修改共享变量，我上了锁
你们都别想改，我改完了解开锁，你们才有机会。

原子操作类

juc（java.util.concurrent）中提供了原子操作类，可以提供线程安全的操作，例如：AtomicInteger、
AtomicBoolean等，它们底层就是采用 CAS 技术 + volatile 来实现的。
可以使用 AtomicInteger 改写之前的例子
使用 AtomicInteger 类，可以保证线程安全。

// 创建原子整数对象
private static AtomicInteger i = new AtomicInteger(0);
public static void main(String[] args) throws InterruptedException {
	Thread t1 = new Thread(() -> {
		for (int j = 0; j < 5000; j++) {
			i.getAndIncrement(); // 获取并且自增 i++
			// i.incrementAndGet(); // 自增并且获取 ++i
		}
	});
	Thread t2 = new Thread(() -> {
		for (int j = 0; j < 5000; j++) {
			i.getAndDecrement(); // 获取并且自减 i--
		}
	});
	t1.start();
	t2.start();
	t1.join();
	t2.join();
	System.out.println(i);
}

synchronized 优化

Java HotSpot 虚拟机中，每个对象都有对象头（包括 class 指针和 Mark Word）。Mark Word 平时存
储这个对象的哈希码、分代年龄，当加锁时，这些信息就根据情况被替换为标记位、线程锁记录指针、重量级锁指针、线程ID 等内容。

轻量级锁

如果一个对象虽然有多线程访问，但多线程访问的时间是错开的（也就是没有竞争），那么可以使用轻量级锁来优化。
轻量级锁不是为了代替重量级锁，它的本意是在没有多线程竞争的前提下，减少传统的重量级锁使用操作系统互斥量产生的性能消耗。

加锁过程：
每个线程都的栈帧都会包含一个锁记录的结构，内部可以存储锁定对象的 Mark Word。

轻量级锁加锁过程

首先，JVM在当前线程栈帧中创建用于存储锁记录的空间；
将对象头中的Mark Word复制到锁记录中，称为Displaced Mark Word；
对象 Mark Word中的两位记录着对象是否加锁（01 无锁 00 轻量锁 10 重量锁），若发现对象无锁，线程尝试使用CAS将对象头中的 Mark Word 替换为指向锁记录的指针，成功则代表获得锁，失败表示其他线程竞争锁，当前线程尝试使用自旋操作来获取锁。
获取锁成功，更新锁标记为 00表示对象加轻量级锁。

解锁过程：

将锁记录中存储的 mark word 写回加锁的对象。
对象的锁标记改为 01 表示无锁

轻量级锁膨胀：
在进行CAS 轻量级加锁的时候，加锁失败，说明存在竞争，进行锁膨胀，将轻量级锁变为重量级锁。
如线程 t 对一个对象加锁失败，进行锁膨胀，使用 CAS 修改Mark 为重量锁（锁标记改为 10表示重量锁），然后在对象头中设置重量锁指针，线程阻塞。等待线程对加锁对象解锁的时候，根据重量锁指针，唤醒阻塞线程。

重量级锁-自旋

重量级锁竞争的时候，还可以使用自旋来进行优化，如果当前线程自旋成功（即这时候持锁线程已经退出了同步块，释放了锁），这时当前线程就可以避免阻塞。
在 Java 6 之后自旋锁是自适应的，比如对象刚刚的一次自旋操作成功过，那么认为这次自旋成功的可能性会高，就多自旋几次；反之，就少自旋甚至不自旋，比较智能。

自旋：尝试加锁失败后，不立即阻塞，而是多尝试几次加锁。（如果，持锁的线程很快完成解锁，则避免阻塞）
自选失败：重试多次，未得到锁，自旋失败，进入阻塞。

自旋会占用 CPU 时间，单核 CPU 自旋就是浪费，多核 CPU 自旋才能发挥优势。
好比等红灯时汽车是不是熄火，不熄火相当于自旋（等待时间短了划算），熄火了相当于阻塞（等
待时间长了划算）
Java 7 之后不能控制是否开启自旋功能

偏向锁

轻量级锁在没有竞争时（就自己这个线程），每次重入仍然需要执行 CAS 操作。Java 6 中引入了偏向锁来做进一步优化：只有第一次使用 CAS 将线程 ID 设置到对象的 Mark Word 头，之后发现这个线程 ID是自己的就表示没有竞争，不用重新 CAS。

撤销偏向需要将持锁线程升级为轻量级锁，这个过程中所有线程需要暂停（STW）
访问对象的 hashCode 也会撤销偏向锁
如果对象虽然被多个线程访问，但没有竞争，这时偏向了线程 T1 的对象仍有机会重新偏向 T2，
重偏向会重置对象的 Thread ID
撤销偏向和重偏向都是批量进行的，以类为单位
如果撤销偏向到达某个阈值，整个类的所有对象都会变为不可偏向的
可以主动使用 -XX:-UseBiasedLocking 禁用偏向锁

其它优化

1.减少上锁时间，同步代码块中尽量短
2.减少锁的粒度，将一个锁拆分为多个锁提高并发度，例如：
2.1 ConcurrentHashMap
2.2 LongAdder 分为 base 和 cells 两部分。没有并发争用的时候或者是 cells 数组正在初始化的时候，会使用 CAS 来累加值到 base，有并发争用，会初始化 cells 数组，数组有多少个 cell，就允许有多少线程并行修改，最后将数组中每个 cell 累加，再加上 base 就是最终的值
2.3 LinkedBlockingQueue 入队和出队使用不同的锁，相对于LinkedBlockingArray只有一个锁效率要高
3.锁粗化
多次循环进入同步块不如同步块内多次循环，另外 JVM 可能会做如下优化，把多次 append 的加锁操作粗化为一次（因为都是对同一个对象加锁，没必要重入多次）

new StringBuffer().append("a").append("b").append("c");

4.锁消除
JVM 会进行代码的逃逸分析，例如某个加锁对象是方法内局部变量，不会被其它线程所访问到，这时候就会被即时编译器忽略掉所有同步操作。
5. 读写分离
CopyOnWriteArrayList
ConyOnWriteSet

JVM 完结

红尘不染

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
JVM第十五篇（完结篇内存模型）

这是目录JMM（java内存模型）原子性可见性有序性happens-beforeCASCAS底层原理乐观锁与悲观锁：原子操作类synchronized 优化轻量级锁重量级锁-自旋偏向锁其它优化JVM 完结JMM（java内存模型）java 内存模型是 Java Memory Model（JMM）的意思。简单的说，JMM 定义了一套在多线程读写共享数据时（成员变量、数组）时，对数据的可见性、有序性、和原子性的规则和保障。原子性原子性：一个或多个操作是不可中断的，要么全部执行，要么全部执行失败。原子
复制链接

扫一扫