volatile和synchronized底层实现原理

相关的CPU术语

术语英文单词术语描述
内存屏障memory barriers是一组处理器指令,用于实现对内存操作的顺序限制
缓冲行cache line缓存中可以分配的最小存储单位。处理器填写缓存线时会加载整个缓存线,需要使用多个主内存读周期
原子操作atomic operation不可中断的一个或一系列操作
缓存行填充cache line fill当处理器识别到从内存中读取操作数时可缓存的,处理器读取真哥哥缓存行到适当的缓存(L1,L2,L3或所有)
缓存命中cache hit如果进行高速缓存行填充操作的内存位置仍然是下次处理器访问的地址时,处理器从缓存中读取操作数,而不是从内存读取
写命中write hit当处理器将操作数写回到一个内存缓存的区域时,它首先回检查这个缓存的内存地址是否在缓存行中,如果存在一个有效的缓存行,则处理器将这个操作数写回到缓存,而不是内存,这个操作称为写命中
写缺失write miss the cache一个有效的缓存行被写入到不存在的内存区域

volatile

volatile是轻量级的synchronized,在多处理器开发中保证了共享变量的可见性。不会引起线程上下文切换和调度。

volatile的定义与实现原理

有volatile修饰的共享变量进行写操作的时候会多出一行lock前缀的指令。
lock前缀的指令在多核处理器下会引发两件事:

  1. 将当前处理器缓存行的数据写回到系统内存。

lock 前缀的指令导致在执行指令期间,声言处理器的LOCK#信号。在多处理器环境中,LOCK#信号确保在声言该信号期间,处理器可以独占任何共享内存。但是,在最近的处理器,LOCK#信号一般不锁总线,而是锁缓存,锁总线开销大。

  1. 这个写回内存的操作回事其他CPU里缓存了该内存地址的数据无效。

处理器使用嗅探技术保证它的内部缓存、系统内存和其他处理器的缓存的数据在总线上保持一致。如果一个正在共享的状态的地址被嗅探到其他处理器打算写内存地址,那么正在嗅探的处理器将使它的缓存行无效,在下次访问相同内存地址时,强制执行缓存行填充。

为了提高处理速度,处理器不直接和内存进行通信,而是先将系统内的数据读到内部缓存(L1、L2或其他)后再进行操作,但操作完不知道何时会写到内存。

volatile使用优化

追加字节优化性能:一些处理器的缓存行是64字节款,追加字节能减少不必要参数锁的对象被加载到缓存行导致锁并发效率低。
LinkedTransferqueue,用追加到64位字节的方式来填满高速缓冲区的缓存行,避免头节点和尾戒戴呢加载到同一个缓存行,使,头围节点在修改时不会互相锁定。
但不是所有使用volatile变量时都因该追加到64字节:

  1. 缓存行非64字节宽度:一些处理器的缓存行是32个字节宽度
  2. 共享变量不会被频繁地写:因为追加字节的方式需要处理器读取更多的字节到高速缓冲区,这本身会带来一定的性能消耗,如果共享变量不会频繁写的话,锁的几率也会非常小,就没有必要通过追加字节的方式来避免相互锁定。

这种追加字节的方式在Java7下可能不生效。因为它会淘汰或重新排列无用字段。

synchronized的实现原理

重量级锁。但随着JDK版本迭代,synchronized并没有那么重了。
synchronized实现同步的形式

  1. 对于普通同步方法,锁是当前实例对象
  2. 对于静态同步方法,锁是当前的Class对象
  3. 对于同步方法块,锁是Synchronized括号里配置的对象
    synchronized是JVM层的实现,JVM基于进入和退出Monitor对象来实现方法同步和代码块同步。
    代码块同步:使用monitorenter和monitorexit指令实现
    方法同步:使用另一种方式实现(JVM规范里没讲)但是也可以使用这两个指令实现。
    monitorenter指令是在编译后插入到同步代码块开始的位置,monitorexit是插入到方法结束处的异常处
    任何一个对象都有一个monitor与之关联,当且一个monotor被持有后,它将处于锁定状态。线程只从到monitorenter指令时,将会藏式回去对象所对应的monitor的所有权,即藏式获取对象的锁。

java对象头

synchronized用的锁存在Java对象头里。如果对象时数组类型,则虚拟机用3个字宽(Word)存储对象头,如果对象时飞数组类型,则用2个字宽存储对象头。在32位虚拟机里,1字宽等于4字节,即32bit。

对象头的长度

长度内容说明
32/64bitMark Word存储对象的hashCode或锁信息等
32/64bitClass Metadata Address存储对象类型数据的指针
32/32bitArray length数组铲毒(如果当前对象时数组)

Java对象头里的Mark Word里默认存储对象的HashCode、分代年龄和锁标记位。
Java对象头存储结构(32位JVM)

锁状态25bit4bit1bit 是否是偏向锁2bit 锁标志位
无锁状态对象的hashCode对象的分代年龄001

Java对象头存储结构(64位JVM)

锁状态25bit31bit1bit cms_free4bit 对象的分代年龄1bit 是否是偏向锁2bit 锁标志位
无锁状态unused对象的hashCode001
偏向锁ThreadID(54bit)Epoch(2bit)ThreadID(54bit)Epoch(2bit)101

Mark Word的状态变化
在这里插入图片描述

锁的升级与对比

偏向锁

大多数情况下,锁不仅不存在多线程竞争,而且总是由统一线程多次获得,为了让线程获得锁的代价更低而引入了偏向锁。
当一个线程访问同步块获得锁时,对象头和栈帧中锁记录里存储锁偏向的线程ID,以后线程在进入和退出同步块是不需要进行CAS操作来加锁和解锁,只需要简单地测试一下对象头的Mark Word里是否存储这指向当前线程的偏向锁,如果测试成功,表示线程已经获得了锁。入股哦测试失败,则需要在测试胰腺癌Mark Word中偏向锁的标识适度设置成1(表示当前是偏向锁):如果没有设置苛责使用CAS竞争锁;入股哦设置了,则藏式使用CAS将对象头的偏向锁指向当前线程。

偏向锁的初始化和撤销
在这里插入图片描述
偏向锁使用了一种等到竞争出现才释放锁的机制,所以当其他线程藏式竞争偏向锁时,持有偏向锁的线程才会释放锁。
偏向锁的撤销需要等待全局安全点(在这个时间点上没有正在执行的字节码)。它会首先暂停暂停拥有偏向锁的线程,然后检查持有偏向锁的线程是否活着,如果线程不处于活动状态,则将对象头设置成无锁状态;如果线程仍然活着,拥有偏向锁的栈会被执行,遍历偏向对象的锁记录,栈中的锁记录和推向头的Mark Word要么重新偏向于其他线程,要么恢复到无锁或者对象不适合作为偏向锁,最后唤醒暂停的线程。
关闭偏向锁
偏向锁在java6和7是默认开启的,但是在应用程序启动几秒之后才激活。可以使用JVM参数:-XX:BiasedLockingStartupDelay=0。如果确定程序里所有的锁通常情况下处于竞争状态,可以通过JVM参数:-XX:-UseBiasedLocking=false,那么应用程序会进入轻量级锁状态。

轻量级锁

在这里插入图片描述

轻量级锁加锁
线程在执行同步块之前,JVM回先在当前线程的栈帧中创建用于存储锁记录的空间,并将对象头中Mark Word复制到锁记录中,官方称为“Displaced Mark Word”。然后线程尝试使用CAS将对象头中的Mark Word替换为指向锁记录的指针。如果成功,当前线程获得锁,如果失败,表示其他线程竞争锁,当前线程便尝试使用自旋来获取锁。
轻量级锁解锁
轻量级锁解锁时,会使用原子的CAS操作将Displaced Mark Word替换回到对象头,如果成功,则表示没有竞争发生。如果失败,表示当前锁存在竞争,锁就会膨胀成重量级锁

因为自旋会消耗CPU,为了避免无用的自旋(比如获得锁的线程被阻塞住了)一旦锁升级成重量级锁,就不会在恢复到轻量级锁状态。当锁处于这个状态下,其他线程试图获取锁时,都会被阻塞住,当持有锁的线程释放锁之后会唤醒这些线程,被唤醒的线程会进行新一轮的夺锁之争。

锁的优缺点对比

优点缺点适用场景
偏向锁加锁和解锁不需要额外的消耗,和执行非同步方法相比仅存在纳秒级的差距如果线程间存在锁竞争,会带来额外的锁撤销操作适用于只有一个线程访问同步块场景
轻量级锁竞争的线程不会阻塞,提高了程序的响应速度始终得不到锁竞争的线程,使用自旋会消耗CPU追求响应时间,同步块执行速度非常快
重量级锁线程竞争不使用自旋,不会消耗CPU线程阻塞,响应时间缓慢追求吞吐量,同步块执行速度较长
  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值