java并发编程的艺术_java并发编程艺术-CSDN博客

本文链接：https://blog.csdn.net/qq_35693377/article/details/136103510

java并发编程的艺术
第一章–并发的挑战
1。上下文切换
上下文切换是由于多任务操作系统需要管理多个线程或进程的并发
第二章—java并发机制的底层实现原理
java代码编译成字节码，然后被类加载器加载到jvm中，jvm执行，最终转换为汇编指令在cpu上执行，java的并发机制依赖于jvm和cpu的指令。
1.volatile的应用
volatile加在共享变量上，保证所有线程看到这个变量的值是一致的，即valoatile变量相当于加了一个读写锁，是通过原子操作实现的。
实现原理：汇编代码给volatile变量加了lock前缀指令。
lock指令：将当前cpu缓存的volatile变量写回系统内存，使其他cpu缓存中的volatile变量数据无效。

MESI 协议是一种常见的缓存一致性协议，用于处理多处理器系统中的缓存一致性问题。
1.Modified（M）
：这个状态表示缓存行已被修改，并且与主存中的数据不一致。这意味着这个缓存行中的数据是处理器专有的，并且尚未写回主存。其他处理器无权访问此缓存行。
2.Exclusive（E）私有的
：这个状态表示缓存行是干净的，与主存中的数据一致。这个缓存行只存在于一个处理器的缓存中，其他处理器没有副本。当一个处理器读取数据时，数据会从主存加载到这个处理器的缓存中，并切换到 Exclusive 状态。
3.Shared（S）
：这个状态表示缓存行是干净的，与主存中的数据一致。多个处理器可以拥有这个缓存行的副本，因此在多处理器系统中，它可以存在于多个处理器的缓存中。如果一个处理器写入了这个缓存行，它必须先将其转换为 Modified 状态，然后进行修改。
4.Invalid（I）
：这个状态表示缓存行是无效的，无法使用。这可能是因为其他处理器修改了与之相关的数据，或者处理器主动将其标记为无效。在 Invalid 状态下，缓存行不能用于读或写操作。

MESI 协议的一般实现方式：
1.状态标记
：每个缓存行都有一个状态标记，用于表示它的状态，可以是 Modified（M）、Exclusive（E）、Shared（S）、或 Invalid（I）之一。处理器在缓存中维护这些标记，以跟踪每个缓存行的状态。
2.缓存操作
：当处理器进行缓存读取或写入操作时，MESI 协议规定了缓存状态的转换条件。例如，如果一个处理器要读取一个缓存行，但当前状态为 Invalid（I），则它必须从主存中加载数据，将状态转换为 Exclusive（E）或 Shared（S），并执行读取操作。
3.写回和写分配
：当处理器对一个缓存行执行写入操作时，MESI 协议规定了数据如何写回主存以保持一致性。如果一个缓存行处于 Modified（M）状态，写回主存是必需的，然后状态转换为 Exclusive（E）。如果处于 Exclusive（E）状态，写入操作可以直接写入缓存，不需要写回主存。
4.缓存间通信
：当一个处理器修改一个缓存行并使其状态从 Exclusive（E）转换为 Modified（M）时，它必须通知其他可能拥有该缓存行的处理器。这通常涉及到发送消息或信号给其他处理器，以通知它们相应缓存行的状态变化。
5.原子操作
：在某些情况下， MESI 协议需要保证多个缓存操作是原子的，以确保数据一致性。这可能涉及到使用原子操作来实现状态的转换和数据的读写，以防止竞态条件。
MESI 协议的实现要求硬件支持，并且通常由处理器内部的缓存控制逻辑来管理。硬件支持 MESI 协议可以确保缓存状态的正确管理和转换，从而确保数据的一致性。不同的处理器架构和硬件实现可能会略有不同，但遵循了 MESI 协议的一般原则。

1.缓存锁定（Cache Locking）：缓存行锁后，其他缓存中的share状态数据转换为invalid，需要重新加载。
：

缓存锁定是一种方法，通过它可以锁定缓存中的某些数据，防止其被其他处理器修改。
当一个处理器锁定缓存中的数据时，其他处理器将不能修改或访问这些数据，从而确保数据一致性。
缓存锁定通常以粒度更细的方式进行，例如锁定某个特定的缓存行，而不是整个缓存。
这种方法通常会引入更低的争用，因为只有某些数据被锁定，而其他数据可以继续并发访问。
2.总线锁定（Bus Locking）：锁总线后，其他cpu无法访问内存，从而保证一致性，但是很影响性能。
同时处理器也实现了嗅探技术来保证缓存一致性。
嗅探技术：
当一个处理器中的缓存进行修改后，会在总线上通知其他处理器，将其他处理器的share状态改变为invalid。
硬件的缓存一致性是通过，MESI状态转换和嗅探技术实现的。

2.synchronized的实现
synchronized保证一个方法或者代码块同时只有一个线程执行（不会发生中断和抢占）。
（1）Java中每个对象都可以作为锁（对象头）
具体实现：
《1》普通同步方法：锁是当前实例对象。
《2》静态同步方法：锁是当前类的class文件。
《3》对于配置了synchonized对象的，锁是配置对象。
当进程访问代码块时，必须先得到锁，退出或抛出异常时释放锁。
synchronized是通过jvm实现的，jvm是通过monitorenter和monitorexit指令实现的。
monitorenter获得对象锁，monitorexit释放对象锁。对象锁存在于对象头中。
对象头的内容：对象锁信息，
markword：存储对象的hashcode和锁信息。
ClassMetadataAddress：对象的元数据（包括方法表，构造方法，成员变量。。）
arrayLength：数组的长度（如果是数组的话,如果不是数组没有这个)
锁存在于MarkWord中：
锁状态25bit4bit1bit是否是偏向锁2bit锁标志位对象的hashcode对象分代年龄001
各种锁的MarkWord：
轻量级锁指向栈中锁记录的指针00重量级锁指向互斥量（重量级锁）的指针10GC标记11偏向锁线程IDepoch，对象分代年龄101
（2）锁升级
在synchronized中有四种级别的锁：无锁状态，偏向锁状态，轻量级锁状态，重量级锁状态。
锁只能升级，不能降级。
（1）偏向锁：一个锁由一个对象多次获得，为了代价最低，引入了偏向锁
当一个线程获得了无锁状态的锁，那么就会将自己线程ID通过CAS记录进对象头MarkWord中，从无锁升级为偏向锁。
当线程再次获得了锁对象，就检测一下锁对象的对象头的MardWCASDord中的偏向锁是否是自己的线程ID，如果是直接用，如果不是则用CAS修改为自己的线程ID，然后使用。
如果CAS失败次数超过自旋阈值（也就是存在大量竞争），那么就将升级为轻量级锁。
（2）轻量级锁：
jvm现在当前线程的栈中创建用于存储锁记录的空间，并且将对象头中的MarkWord复制到锁记录中，然后线程会尝试用CAS将对象头中的markword替换为指向锁的指针（指向栈的指针），如果成功，当前线程获得锁，如果失败，表示其他进程在竞争锁，当前线程便使用自旋来获得锁。
如果自旋很多次都没有获得锁，那么就会膨胀成重量级锁。
（3）重量级锁
这是一个互斥锁，一旦线程完成了synchronized就会释放锁，其他进程竞争锁。
没有获得锁的进程会进入阻塞，当有锁时候会被唤醒，这会造成上下文切换，造成较大的性能损失。

2。处理器实现原子操作
当存在跨总线宽度，跨多个缓存行和跨页表时候，处理器不能保证其原子性，但是可以提供总线锁定和缓存锁定来保证原子性。
MESI协议
（1）总线锁定：当一个cpu处理时，其他cpu无法访问这个内存。
（2）缓存锁定：使用缓存一致性MESI，使用缓存行时候，其他cpu缓存中的共享缓存行设置为invalied。

3。java实现原子操作
（1）使用循环CAS
缺点：ABA问题，占用cpu使用，只能保证一个原子元素的原子操作。
（2）使用锁

第三章----java内存模型：线程间通信，顺序一致性
java是通过共享内存来实现进程间通信的。
同步是指程序中应用于控制不同进程间操作发生的相对顺序的操作。
对于实例域和静态域和数组是存储在主内存中的，是共享变量，需要从主内存中取出然后放在属于内存的本地内存中。
本地内存并非真实存在，它是cpu缓存，寄存器的抽象概念。
局部变量存在本地内存上。
进程间通信就是通过修改共享变量来实现的。线程修改本地内存，然后刷入主内存。
（1）从源代码到指令代码的重排序
编译器和处理器为了提高效率，会对指令作重排序。
源代码-》编译器优化重排序-》指令级并行重排序-》内存系统重排序-》最终指向的指令序列
这些重排序会导致并行执行发生冲突。
对于编译器级别的重排序，JMM会禁止部分编译器的重排序。
对于处理器级别的重排序，JMM会Java编译器在生成指令序列时候，插入内存屏障，通过内存屏障来实现对处理器重排序的禁止。
JMM（java内存模型）是语言级别的内存模型，它确保在不同编译器和处理器平台上，通过禁止重排序，来实现一致的内存可见性保证。
（2）内存屏障：通过缓存刷入保证，顺序一致性
有四种屏障，只拿StoreLoad Barriers举例。
StoreLoad Barriers : Store 1 ;StoreLoad; Load 2;
确保先将数据保存到主内存，然后加载出到本地内存中（加载出的是新数据）。
执行该屏障花费很大，会将cpu缓存中所有的数据都刷入到内存中（flush）。
（3）happens-before关系：一个偏序关系
happens-before关系代表：前一个执行结果对于u后一个操作可见，且第一个操作在第二个操作之前。
是一种为了对程序员方便的抽象概念。
（4）数据依赖性：后一个操作依赖前一个操作
单线程的数据依赖性，编译器和处理器会自然保证顺序。
对于数据依赖关系的操作，编译器和处理器不会进行重排序。
不管怎样，单线程的执行结果不会被改变，这就是as-if-serial语义。
（5）当单线程happens-before不会影响结果的，会重排序提高并行性。
（6）顺序一致性内存模型：所有进程串行执行
在顺序一致性模型中，操作是全序关系，每个线程都全知整体。
但是JMM没有这个保证，未同步程序整体是无须的，并且线程也不知道彼此之间的执行顺序。
（7）JMM实现同步程序的顺序一致性的相似效果
通过给临界区加锁，临界区内的代码可以重排序（但是不能溢出到临界区外），临界区外的代码也可以重排序。
这种JMM方法，在不改变执行结果的前提下，尽可能地位编译器和处理器的优化开方便之门。
（8）未同步（没有加锁。。）的执行特征
不会保证和顺序一致性内存模型相同的执行结果。
为了实现最小安全性，JVM在分配对象时，首先会对内存空间清零。
1.volatile的内存语义
使用volatile相当于给变量操作都加锁，保证不会中断，而且刷入主内存。
volatile能建立happens-before关系，volatile读写不能重排序，是编译器在生成字节码文件时，在指令序列中插入内存屏障来阻止处理器重排序实现的。
屏障通过刷入主内存来阻止，屏障上下进行重排序。
JMM对于volatile十分保守：在每一个volatile写的后面或读的前面都会插入一个内存屏障。
所有类型的屏障都是通过组织屏障两边重排序实现的。

2.锁的内存语义
临界区：共享资源，可能被多个线程访问。需要同步控制，保证一个时间，只有一个线程访问。
锁的释放–获取建立的happens-before关系。
锁除了让临界区互斥执行外，还可以让释放的锁的线程向获取锁的进程发送消息（保证happens-before）。
实例方法，synchronized在调用的对象上加锁，每个对象实例都能唯一使用，多个对象可以同时执行。
静态方法，在类的class上加锁，只能有一个对象调用。
（1)锁的释放和获取的内存语义
线程获取锁时，线程的本地内存无效，需要去主内存中获取。
线程释放锁时，线程会将本地内存写入主内存。
（2）公平锁和非公平锁都是通过一个volatile变量实现的。

3.final域的内存语义
final：不可变
final类：不可继承
final方法：不可重写
final值：常量
（1）final的重排序规则
禁止将final域的写操作，重排序到构造函数之外。
实现：JMM禁止把final域的写重排序到构造函数之外。编译器会将构造函数返回之前，插入内存屏障，将缓存写入主内存。
（2）作用：
一个对象初始化给其他线程执行，成员变量的初始化可能重排序到返回对象之后，从而导致其他线程检测到了这个引用对象，但是对象的成员变量为0。
而final确保了在引用对象被所有线程可见之前，final域已经在构造函数返回对象之前初始化完成了，其他线程看到的都是初始化后的。

4.happens-before
happens-before时指两个操作之间的执行顺序，可以在一个线程，也可以不在。
程序员不想要重排序，为了容易理解。
而电脑想要重排序，为了效率。
所以JMM：改变结果的重排序被禁止，而不改变结果的被允许。
例如：如果一个锁只会被一个线程访问，那么锁就被消除了。volatile变量也是。
happens-before的规则：
（1）一个线程中，结果串行。
（2）锁解锁后，happens-before随后对锁加锁。
（3）volatile，写happens-before读。
（4）传递性
（5）Thread.start()在这个线程的所有操作之前。
（6）Thread.join()happens-before 这个线程的所有操作。

5.线程安全的初始化
延迟初始化：懒汉模式，用的时候才初始化
但是面对多线程的访问，延迟初始化可能会看到引用对象没有初始化的值。（因为普通变量重排序到了构造函数return之后）。
我们的解决办法是：给初始化加synchronized。（synchronized在进入时会加内存屏障，出去时也会加内存屏障，确保synchronized代码中的操作输入主内存中）相当于成为了一个原子操作。同时保证只有一个线程能创建对象，不会引起多个线程创建的问题。

synchronized static instance getInstance(){
if(instance==null)
instance=new instance;
return instance;
}

但是开销很大。
双重检查锁定方法：

public static Instance getInstance(){
if(instance==nul){
synchronized(this.class){
if(instance==null)
instance=new instance;
}
}
return instance;
}

如果第一次检查不为空就不会执行synchroized的代码，从而减少开支。
但是这是有问题的，第一次检查对象不为空，但是对象还没有初始化完成，这样返回这个对象，会出问题的。（synchronied有内存屏障保证了初始化的完整性，而这个没办法保证）
《》双重检查锁定延迟初始化问题的根源
创建一个对象，其过程可以分解为：
（1）分配空间
（2）初始化
（3）指向这个空间
在单线程中，可以交换2和3，即先指向再初始化，不会影响结果。
所以双重检查延迟初始化的多线程执行过程如下：
（1-a线程）分配instance空间
（2-a线程）设置instance指向分配的空间
（3-b线程）判断instance不为空，访问instance
（4-a线程）初始化instance。
（5-a线程）访问instance。
在知晓了问题根源后，我们的解决方案如下：
（1）不允许指向insatnce空间和初始化instance重排序。
（2）允许重排序，但是保证两个操作不可中断（原子性）。
《1》基于volatile的解决方案
volatile也会在进入和出去之前加内存屏障，所以能保证所有线程看到的都是最新的。
而给instance加上volatile，那么就会在初始化后才能读。
《2》基于类初始化的解决方案

第四章–java并发基础
1.并发与并行
并发是多cpu，并行是时间块轮询。
2.进程状态
new，runnable,blocked(阻塞于锁）,waiting（等被通知唤醒）,time_waiting（超时等待）,terminated
3.Daemon线程
只有当所有非守护线程结束后，才自动结束。
Daemon的finally代码不会执行，不能依靠finally来执行关闭或清理。
4.构造线程
一个新构造的线程对象是由其parent线程来进行空间分配的，以及继承了parent的是否为Daemon，优先级，和加载资源的contextClassLoader和可继承的ThreadLocal，同时还会分配一个唯一的Id来标识这个线程，至此，一个可以运行的线程对象就初始化好了，在堆中等待着运行了。
使用start（）来启动进程。
5.中断：interrupt是进程间通信的一种方式
中断就是一个标识位属性，其他线程的interrupt（），会将其设置为true。
线程通过检查自身是否被中断来进行响应，通过isInterrupute来判断是否被中断。
中断标识为true，程序并不会终止。想要终止需要程序员主动检查标志位，主动终止程序。