计算机在执行程序的时候,每条指令都是cpu在执行,由于cpu的执行速度快,而与主存(物理内存)的数据读写速度比较慢,所以cpu里面就有了一个高速缓存。就是程序在运行的时候,会将运算需要的数据复制一份到高速缓存里,然后计算的时候,就可以直接从高速缓存中读取数据和向其中写入数据,运算结束时,再将高速缓存中的数据刷新到主存中。
在多核CPU中,每条线程可能运行于不同的CPU中,因此每个线程运行时有自己的高速缓存,所以牵扯到缓存一致性问题,通常将多个线程访问的变量定义为共享变量。
为了解决缓存不一致的问题通常用的两种方法:
1)通过在总线加LOCK#锁的方式
2)通过缓存一致性协议
但是上面的方式会有一个问题,由于在锁住总线期间,其他CPU无法访问内存,导致效率低下。
所以就出现了缓存一致性协议。最出名的就是Intel 的MESI协议,MESI协议保证了每个缓存中使用的共享变量的副本是一致的。它核心的思想是:当CPU写数据时,如果发现操作的变量是共享变量,即在其他CPU中也存在该变量的副本,
因此当其他CPU需要读取这个变量时,发现自己缓存中缓存该变量的缓存行是无效的,那么它就会从内存重新读取。
在并发编程中,我们通常会遇到以下三个问题:原子性问题,可见性问题,有序性问题。我们先看具体看一下这三个概念:
原子性:即一个操作或读个操作要么全部执行要么全部失败;经典的有银行转账的问题,反映到并发编程上,一个线程在执行过程中别的线程来获取数据,导致数据不一致
可见性是指多个线程访问一个变量,一个线程改变某一变量的时候,别的线程能立即看到改变后的数据;
举个简单的例子:例如先定义一个变量,变量在运算时会先将数据复制到cpu的高速缓存,计算结束后数据再刷新到主存中,这时当另外的cpu执行的线程访问这一数据时是在刷新到主存之前,则拿到的数据是计算之前的数据,就会出现数据的不一致,即一个线程修改了,另一个线程没有立即看到修改后的值。
有序性:即程序的执行顺序按照代码的顺序执行;
jvm在真正执行代码的时候,一般为了优化效率会进行指令重排序,但是执行结果会是一样的。指令重排序时会考虑数据的依赖性,保证结果的一致性,不会影响单线程的执行结果,但会影响到并发执行的正确性
如线程1执行的两个语句没有数据依赖性,执行后面的语句后,执行线程2的语句时需要用到线程1没有执行到的语句,这时就会出现问题。
也就是说,要想并发程序正确的执行,必须保证程序的原子性,可见性,有序性。
JVM内存模型:
volatile保证变量的可见性,和禁止指令重排序,但是无法保证操作的原子性,如i++的操作,是先将从主存取值再加一,写入新值。只有简单的读取、赋值(而且必须是将数字赋值给某个变量,变量之间的相互赋值不是原子操作)才是原子操作。
需要保证操作是原子性操作,才能保证使用volatile关键字的程序在并发时能够正确执行。
用volatile修饰之后就变得不一样了:
第一:使用volatile关键字会强制将修改的值立即写入主存;
第二:使用volatile关键字的话,当线程2进行修改时,会导致线程1的工作内存中缓存变量stop的缓存行无效(反映到硬件层的话,就是CPU的L1或者L2缓存中对应的缓存行无效);
第三:由于线程1的工作内存中缓存变量stop的缓存行无效,所以线程1再次读取变量stop的值时会去主存读取。