1. volatile定义与实现原理
1.1 定义
确保共享变量能够被准确和一致的更新,线程应该确保通过排他锁单独获得这个变量,若一个字段被声明为volatile,Java线程内存模型确保所有线程看到这个变量的值时一致的。
1.2 当volatile修饰变量,CPU会做什么事情?
比如:volatile instance = new Singleton();转变成汇编代码如下:
0X01a3d1d:movb $0x0, 0x1104800(%esi); 0x01a3de24: lock add1 $0x0, (%esp)
主要做了两件事:
1)将当前处理器缓存行的数据写回到系统内存
2)这个写回内存的操作会使在其他CPU里缓存了该内存地址的数据无效
1.3 使用优化
如何做:追加字节能优化性能,将共享变量追加到64字节
为什么:对于酷睿I7和Pentium M处理器的L1、L2或L3缓存的高速缓存行是64个字节宽,不支持部分填充缓存行,若头节点和尾节 点都不足64字节,处理器会将他们读到同一个高速缓存行中,每个处理器都会缓存同样的头、尾节点,当一个节点试图修改头节点时,会锁定整个缓存行,在缓存一致性机制的作用下,会导致其他处理器不能访问自己高速缓存中的尾节点
例外情况:1)缓存行非64字节宽的处理器。2)共享变量不会被频繁的写
2. Synchronized的实现原理与应用
2.1 表现
1)对于普通同步方法,锁是当前实例对象
2)对于静态同步方法,锁是当前类的Class对象
3)对于同步方法块,锁是Synchronized括号里配置的对象
2.2 概述
2.2.1 实现原理
JVM基于进入和退出Monitor对象来实现方法同步和代码块同步,代码块同步是使用monitorenter和monitorexit指令实现的
2.2.2 流程
monitorenter指令实在编译后插入到同步代码块的开始位置,而monitorexit是插入到方法结束处和异常处,JVM保证每个monitorenter和monitorexit与之配对,任何对象都有一个monitor与之关联,当且一个Moniter被持有后,就会处于锁定状态。线程执行到monitorenter指令时,就会尝试获取对象所对应的monitor的所有权,即对象锁
2.3 具体实现
2.3.1 实现
1)同步代码块采用monitorenter、monitorexit指令显示的实现
2)同步方法则使用ACC_synchronized标记符隐式的实现
2.3.2 具体实现方法
2.3.2.1 monitorenter
描述:
每一个对象都有一个monitor,一个monitor只能被一个线程有用。当一个线程执行到monitorenter指令时会尝试获取相应对象的monitor
获取规则:
1)如果monitor的进入数为0,则该线程可以进入monitor,并将monitor进入数设置为1,该线程即为monitor的拥有者
2)如果当前线程已经拥有该monitor,只是重新进入,则进入monitor的进入数加1,所以synchronized关键字实现的锁是可重入锁
3)如果monitor已被其他线程拥有,则当前线程进入阻塞状态,直到monitor的进入数为0,再重新尝试获取monitor
2.3.2.2 monitorexit
只要拥有相应对象的monitor的线程才能执行monitorexit指令。每执行一次该指令monitor进入数减1,当进入数为0时当前线程释放monitor,此时其他阻塞的线程将可以尝试获取该monitor
3. Java对象头
3.1 概述
Synchronized用的锁是存在Java对象头里,如果对象是数组,则虚拟机用3哥字款存储对象头;如果对象头是非数组类型,则用2字款存储对象头
3.2 对象头长度
1)Mark Word:默认存储对象HashCode、分代年龄和锁标记位
2)Class Metadata Address:存储到对象类型数据的指针
3)Array Length:数组的长度(若当前对象是数组)
3.3 锁
3.3.1 无锁状态
3.3.2 偏向锁
1)描述:大多数情况,锁不仅不存在多线程竞争,而且总是由同一线程多次获得,为了让线程获得锁的代价更低而引入了偏向锁。当一个线程访问同步块并获取锁时,会在对象头和栈帧中的锁记录里存储锁偏向的线程ID,以后该线程在进入和退出同步块时不需要进行CAS操作来加锁和解锁,只需简单地测试一下对象头的Mark Word里是否存储着指向当前线程的偏向锁。如果测试成功,表示线程已经获得了锁。如果测试失败,则需要在测试一下Mark Word偏向锁的标识是否设置成1(表示当前是偏向锁):如果没有设置,则使用CAS竞争锁;如果设置了,则尝试使用CAS将对象头的偏向锁指向当前线程
2)偏向锁的撤销:偏向锁使用了一种等到竞争出现才释放锁的机制,所以当其他线程尝试竞争偏向锁时,持有偏向锁的线程才会释放。偏向锁的撤销,需要等待全局安全点(在这个时间点上没有正在执行的字节码)。它会首先暂停拥有偏向锁的线程,然后检查持有偏向锁的线程是否活着,如果不活动,则将对象头设置成无锁状态;如果活着,拥有偏向锁的栈会被执行,遍历偏向对象的锁记录,栈中的锁记录和对象头的Mark Word要么重新偏向于其他线程,要么恢复到无锁活着标记对象不适合作为偏向锁,最后唤醒暂停的线程
3)关闭偏向锁:在6和7中是默认启动的,但是在应用启动几秒后才激活,可以使用:-XX:BiasedLockingStartupDelay=0来关闭延迟。如果希望程序里所有锁都处于竞争状态,则通过-XX:UseBiasedLocking=false来关闭偏向锁
3.3.3 轻量级锁
1)轻量级锁加锁:线程在执行同步块之前,JVM会先在当前线程的栈帧中创建用于存储锁记录的空间,并将对象头中的Mark Word复制到锁记录中,官方称为Displaced Mark Word。然后线程尝试使用CAS将对象头中的Mark Word替换为指向锁记录的指针。如果成功,当前线程获得锁,如果失败,表示其他线程竞争锁,当前线程便尝试自旋来获取锁
2)轻量级锁解锁:轻量级解锁时,会使用原子的CAS操作将Displaced Mark Word替换回到对象头,如果成功,则表示没有竞争发生。如果失败,表示当前锁存在竞争,锁就会膨胀称重量级锁。
3)总结:自旋会消耗CPU,为了避免无用的自旋,一旦锁升级成重量级锁,就不会再恢复到轻量级锁状态。当锁处于这个状态下,其他锁尝试获取时,都会被阻塞住,当持有锁的线程释放锁之后会唤醒这些线程,被唤醒的线程会进行新一轮夺锁之争
3.3.4 重量级锁
3.3.5 对比
1)偏向锁
优点:加锁和解锁不需要额外的消耗,和执行非同步方法相比仅存在纳秒级的差距
缺点:如果线程间存在锁竞争,会带来额外的锁撤销的消耗
使用场景:适用于只有一个线程访问同步块的场景
2)轻量级锁
优点:竞争的线程不会阻塞,提高了程序的响应速度
缺点:如果始终得不到竞争的线程,自旋会消耗CPU
使用场景:追求响应时间,同步块执行速度非常快
3)重量级锁
优点:线程竞争不使用自旋,不会消耗CPU
缺点:线程阻塞,响应时间缓慢
使用场景:线程阻塞,响应时间缓慢
4. 原子操作的实现原理
4.1 概述
原子操作意为不可被中断的一个或一系列操作
4.2 CPU术语
1)缓存行(Cache Line):缓存的最小操作单位
2)比较并交换(Compare and swap):CAS操作需要输入两个数值,一个旧值和一个新值,在操作期间现比较旧的有没有变化,如果没有发生变化,才交换成新的,发生变化则不交换
3)CPU流水线(CPU pipeline):CPU流水线的工作方式就像工业生产上的装配流水线,在CPU中由5~6个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5~6不厚在执行
4)内存顺序冲突(Memory order violation):内存顺序冲突一半是由假共享引起的,假共享是指多个CPU同时修改同一个缓存行的不同部分而引起其中一个CPU的操作无效,当出现这个内存顺序冲突时,CPU必须清空流水线
4.3 处理器实现原子操作
1)描述
a) 32位IA-32处理器使用基于对缓存加锁或总线加锁的方式来实现多处理器之间的原子操作。
b) 处理器保证从系统内存中读取或写入一个字节是原子的,即当一个处理器读取一个字节时,其他处理器不能访问这个字节的内存地址
2) 机制
a) 使用总线锁保证原子性
(1) 案例
多个处理器同时对共享变量进行i++,期望结果是3,但可能是2
(2) 原因
多个处理器同时从各自的缓存中读取变量i,分别加1操作,然后分别写入系统内存
(3) 解决方法
使用处理器提供的一个LOCK#信号,当一个处理器在总线上输出此信号时,其他处理器的请求被阻塞,该处理器独占共享内存
b) 使用缓存锁保证原子性
(1) 同一时刻,只需要保证某个内存地址的操作是原子性即可,但总线锁定把CPU和内存之间的通信锁住了,锁定期间,其他处理器不能操作其他内存地址的数据
(2) 总线锁把CPU和内存之间的通信锁住,开销比较大。频繁使用的内存会缓存在处理器的L1、L2和L3的高速缓存,那么原子操作可以直接在处理器内部缓存中进行,不需要声明总线锁。
(3) 缓存锁定:指内存区域如果被缓存在处理器的缓存中,并且在Lock操作期间被锁定,那么它执行锁操作会写到内存时,处理器不在总线上声言LOCK#信号,而是修改内部的地址。
(4) 特殊情况(不使用缓存锁定)
1) 当操作的数据不能被缓存在处理器内部,或操作的数据跨多个缓存行,会使用总线锁定
2) 处理器不支持缓存锁定
4.4 Java实现原子操作
4.4.1 使用循环CAS实现原子操作
JVM中的CAS操作正式利用处理器提供的CMPXCHG指令实现的。自旋CAS实现的基本思路就是循环进行CAS操作直到成功为止
4.4.2 CAS实现原子操作的三大问题
1)ABA问题
(a) 描述:CAS操作值时如果没有发生变化则更新,但如果A,变成了B,又变成了A,检查时没有发生变化
(b) 解决方法:每次变量更新把版本号加1,变成了1A->2B->3A,jdk1.5开始,Atomic提供了一个类 AtomicStampReference来解决ABA问题。这个类的compareAndSet方法的作用是首先检查当前引用是否等于预期引用,并且检查当前标志是否等于预期标志,若全相等,则以原子方式更新值
2)循环时间长,开销大
自旋CAS如果长时间不成功,会给CPU带来非常大的执行开销。若JVM能支持处理器提供的pause指令,那会提升效率。pause指令的两个作用:第一,他可以延迟流水线执行指令,使CPU不会消耗过多的执行资源,延迟的时间取决于具体的版本。第二,它可以避免在退出循环的时候因内存顺序冲突而引起CPU流水线被清空,从而提高CPU的执行效率。
3)只能保证一个共享变量的原子操作
当对一个共享变量执行操作时,可以使用循环CAS的方式来保证原子操作,但对多个共享变量操作时,循环CAS就无法保证操作的原子性,这时可以用锁。
4.4.3 使用锁机制实现原子操作
锁机制保证了只有获得锁的线程才能保证锁定的内存区域。JVM内部实现了很多中锁机制,有偏向锁、轻量级锁和互斥锁,除了循环锁,实现锁的方式都用了循环CAS。