问题记录
volatile关键字的作用是什么?原理是什么?能否保证线程安全?
volatile最大的特性是 可见性,也即 一个线程对用volatile修饰的是变量进行修改,其他线程可以立即看到更新后的值。(如何实现的?)
volatile还有一个作用是 禁止指令重排。
上面提到线程安全,那么究竟什么是线程安全?多线程执行时,为什么会出现线程不安全?执行指令时,操作系统里面经历了什么?
带着这些问题,在下好好分析一下volatile关键字
线程安全:多个线程访问一个有状态的类时,如果调用方不需要进行额外的处理和同步,该类的行为逻辑仍然正确,那么该类就是线程安全的。
从操作系统的角度出发,思考一下,为什么会出现线程不安全的情况。
我们来看看执行指令时,操作系统进行了什么?
指令包括操作码和操作数,在没有高速缓存的情况下,操作系统执行指令需要从内存中取出指令后,然后cpu识别操作码和操作数,将操作出丢进CPU里的寄存器进行运算。随着计算机的发展,CPU的执行速度原来越快,远大于内存的存储速度。这就是典型的cpu与内存的速度不匹配问题,那么就需要高速缓存来解决这个问题。在多CPU的机器中,每个CPU都有自己的高速缓存,指令执行时,因为程序的局部性原理,从内存中取出一些指令,先丢到各个线程所属CPU的高速缓存,然后CPU和高速缓存之间进行交互。这就是线程不安全的主要原因。说了这么多我自己都晕了。说白了就是,变量在每个线程中有自己的本地副本,如果一个线程对变量进行修改了,其他线程并不能及时看见,会出现脏读的问题,也是缓存一致性问题。
要解决缓存一致性问题有两种方案
第一种方案不值一提,跳过。
第二种方案就是 通过一定协议来确保缓存一致。一个cpu从内存中读取数据到缓存中,进行修改后,立即写入内存,然后会通知其他cpu,这个变量已经无效,需要从内存中重新读取。(是不是有点像通知者模式,对就是这么简单)。这个协议实在太简单了,确保了变量的可见性。可结合下面图片进行理解 图片 自(https://www.cnblogs.com/chenssy/p/6379280.html)
接下来将重心放在volidate上
volidate自然是支持上面方案2这种协议,而且还禁止指令的重排。
那么何为指令重排呢?指令重排是为了提高性能,对没有数据依赖的指令进行重排指令,为的是让指令符合cpu的执行特性,充分发挥CPU的性能。
指令重排包括两part
一、编译器重排
二、处理器重排
顾名思义,就知道什么意思了,在下就不多做解释
指令重排不会影响单线程的执行结果,但会影响多线程下的执行结果。那么应该如何解决呢?很简单,告诉cpu和编译器,在特么的地方不要重排就好了,这就是所谓的著名happen-before操作。简直太简单了。我们可以约定一下happen-before操作来告诉cpu,特定的情况下,不进行重排。详情如下
happens-before完整规则:
主要关注第三条
- 同一个线程中的,前面的操作 happen-before 后续的操作。(即单线程内按代码顺序执行。但是,在不影响在单线程环境执行结果的前提下,编译器和处理器可以进行重排序,这是合法的。换句话说,这一是规则无法保证编译重排和指令重排)。
- 监视器上的解锁操作 happen-before 其后续的加锁操作。(Synchronized 规则)
- 对volatile变量的写操作 happen-before 后续的读操作。(volatile 规则)
- 线程的start() 方法 happen-before 该线程所有的后续操作。(线程启动规则)
- 线程所有的操作 happen-before 其他线程在该线程上调用 join 返回成功后的操作。
- 如果 a happen-before b,b happen-before c,则a happen-before c(传递性)。
那么经过上面讨论,volatile关键字修饰的变量是否就是线程安全的呢?
答案是否定的,volatile关键字只有在操作系统的原子操作下才是线程安全的
比如volatile i = 0 ,两个线程同时执行 ++i 指令
A线程从内存中读取i=0,写入高速缓存cache, 此时缓存中i的值是 0,注意此时还没有进行修改
这时B线程开始执行,从内存中读取i=0,写入高速缓存cache,接着A线程进行i+1=1操作后,马上写入内存,之后线程B同样进行i+1=1操作,因为线程B已经将i写入了缓存,不会再去内存中取新的值,于是产生了线程安全问题。对于volatile修饰的变量,jvm虚拟机只是保证从主内存加载到线程工作内存的值是最新的。有人会问,前面不是说当A线程进行修改后,其他线程的缓存变量会无效吗?那么B线程再去修改的时候,怎么不从内存中读取?我也有同样的疑问,请问有人有答案吗?明明缓存一致性协议中规定,A线程修改后,会通知B线程的对应的缓存失效,那么B线程对i进行修改的时候,为什么不重新从内存load呢?搞不懂。
原因如下
因为i++不是原子操作,要经过读取计算和写回,在读取阶段可以保证最新值,但是如果在写回阶段,值被改变了,cpu就无法知道
这就是为什么volatile定义的变量在多线程做++操作时也是线程不安全的原因。