内存模型(一)

多任务处理在现代计算机操作系统中几乎已经是一项必备的功能了。在许多情况下,让计算机同时去做几件事情,不仅是因为计算机的运算能力台强大,还有一个很重要的原因是计算机的运算速度与它的存储和通信子系统速度的差距太大,大量的时间多花在磁盘I/O、网络通信或者数据库访问上。于是,让计算机处理多项任务则是最容易也是最有效利用计算机运算速度的方式。

除了充分能利用计算机处理器的能力外,一个服务端同时对多个客户端提供服务则是另一个更具体的并发应用场景。衡量一个服务性能的高低好坏,每秒事务处理数(Transactions per second,TPS)是最重要的指标之一。  它代表着一秒内服务端能响应的请求总数,而TPS值与程序的并发能力又有非常密切的关系。

  • 硬件的效率与一致性

在了解JVM并发相关的知识之前,先了解一下物理计算机中的并发问题,因为物理机遇到的并发问题与虚拟机中的情况有不少相似之处,物理机对并发的处理方案对于虚拟机的实现也有相当大的意义。

一个任务的执行,不仅需要处理器“计算”就可以完成,处理器至少要与内存交互,如读取运算数据、存储运算结果等,这个I/O操作是很难消除的,因为不可能仅靠寄存器来完成所有运算任务。由于计算机的存储设备和处理器的运算速度有几个数量级的差距,所以现代计算机系统都不得不加入一层读写速度尽可能接近处理器运算速度的高度缓存(cache)来作为内存与处理器之间的缓冲。缓存的原理是将运算需要使用到的数据复制到缓存中,让运算能快速进行,当运算结束后再从缓存同步回内存之中,这样处理器就无须等待缓慢的内存读写了。

基于高速缓存的存储交互很好地解决了处理器与内存的速度矛盾,但是也为计算机系统带来更高的复杂度,因为它引入了一个新的问题:缓存一致性

在多处理器系统中,每个处理器都有自己的高速缓存,而它们又共享同一主内存。当多个处理器的运算任务都涉及同一块主内存区域时,将可能导致各自的缓存数据不一致,如果真的发生这种情况,那同步回到主内存时以谁的缓存数据为准呢?为了解决一致性的问题,需要各个处理器访问缓存时都遵循一些协议,在读写时要根据协议来进行操作,这类协议有MSI、MESI、MOSI、Synapse、Firefly及Dragon Protocol等。

内存模型,可以理解为在特定的操作协议下,对特定的内存或告诉缓存进行读写访问的过程抽象。不同架构的物理机器可以拥有不一样的内存模型,而JVM也有自己的内存模型。而且JVM中的内存访问操作与硬件的缓存访问操作具有很高的可比性。

除了增加高速缓存之外,为了使得处理器内部的运算单元能尽量被充分利用,处理器可能会对输入代码进行乱序执行优化,处理器会在计算之后将乱序执行的结果重组,保证该结果与顺序执行的结果是一致的,但并不保证程序中各个语句计算的先后顺序与输入代码中的顺序一致,因此,如果存在一个计算任务依赖另一个计算任务的中间结果,那么其顺序性并不能靠代码的先后顺序来保证。与处理器的乱序执行优化类似,JVM的即时编译器中也有类似的指令重排序优化。

  • Java内存模型

JVM虚拟机规范中定义了一种Java内存模型来屏蔽掉各种硬件和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的内存访问效果。而其他的语言,如C、C++则直接使用物理硬件和操作系统的内存模型,因此,会由于不同平台上内存模型的差异,有可能导致程序在一套平台上并发完全正常,而在另外一套平台上并发访问却经常出错,因此在某些场景就必须针对不同的平台来编写程序。

Java内存模型实际上还是利用寄存器、告诉缓存指令集中某些特有的指令来获取更好的执行速度。JDK1.5之后,Java内存模型已经成熟和完善起来了。

(1)主内存与工作内存

Java内存模型的主要目标是定义程序中各个变量的访问规则(这里的变量不像java中定义的变量,这个变量包括了实例字段、静态字段和构成数组对象的元素,但不包括局部变量与方法参数,因为这些是线程私有的,不会被共享,也就不会有竞争),即在JVM中将变量存储到内存和从内存中取出变量这样的底层细节。

为了获得较好的执行性能,java内存模型并没有限制执行引擎使用处理器的特定寄存器或缓存来和主内存进行交互,也没有限制即时编译器进行调整代码执行顺序这类优化措施。

java内存模型规定了所有变量都存储在主内存中(这里的主内存类似与物理机的主内存,只不过这个主内存只是JVM内存的一部分)。每个线程还有自己的工作内存(类似于物理机的高速缓存),线程的工作内存保存了被该线程使用到的变量的主内存副本拷贝,线程对变量的所有操作如读取、赋值等操作必须在工作内存中执行,而不能直接读写主内存中的变量。不同线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成。

注:主内存、工作内存与java内存区域中的堆、栈、方法区等的区别:

       这两种基本上是没有关系的,如果两者一定要勉强对应起来,那么主内存主要对应于java堆中的对象实例数据部分,而工作内存则对应于JVM栈中的部分区域。从更低层次上说,主内存就对应于物理硬件的内存,而为了获得更好的运行速度,JVM可能会让工作内存优先存储于寄存器和高速缓存中,因为程序运行时主要访问读写的是工作内存。

(2)内存间交互操作

关于主内存和工作内存之间具体的交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步回主内存之类的实现细节,java内存模型中定义了以下8种操作来完成,JVM实现时必须保证下面的没种操作都是原子的、不可再分的。

lock(锁定):作用于主内存变量,它把一个变量标识为一条线程独占的状态。

unlock(解锁):作用于主内存变量,它把一个处于锁定状态的变脸释放出来,释放后的变量才可以被其他线程锁定。

read(读取):作用于主内存变量,它把一个变量的值从主内存传输到线程的工作内存中,以便随后的load操作执行。

load(载入):作用于工作内存的变量,它把read操作从主内存得到的变量值放入工作内存的变量副本中。

use(使用):作用于工作内存的变量,它把工作内存中一个变量的值传递给执行引擎,每当JVM遇到一个需要使用到变量的值的字节码指令时将会执行这个操作。

assign(赋值):作用于工作内存的变量,它把一个从执行引擎接收到的值赋给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。

store(存储):作用于工作内存的变量,它把工作内存中一个变量的值传送到主内存中,以便随后的write操作使用。

write(写入):作用于主内存的变量,它把store操作从工作内存中得到的变量的值放入主内存的变量中。

如果要把一个变量从主内存复制到工作内存,那就要顺序地执行read和load操作,如果要把变量从工作内存同步回主内存,就要顺序地执行store和write操作。而且,java内存模型只要求上述两个操作必须按顺序执行,而没有保证是连续执行。

java内存模型还规定了在执行上述八种操作时必须遵循如下规则:

不允许read和load、store和write操作之一单独出现,即不允许一个变量从主内存读取了但工作内存不接受,或者从工作内存发起了回写但主内存不接受的情况出现。

不允许一个线程丢弃它的最近的assign操作,即变量在工作内存中改变了之后必须把该变化同步回主内存。

不允许一个线程无原因地(没有发生过任何assign操作)把数据从线程的工作内存同步回主内存中。

一个新的变量只能在主内存中“诞生”,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量,换句话说,就是对一个变量实施use、store操作之前,必须先执行过了assign和load操作。

一个变量在同一时刻只允许一条线程对其执行lock操作,但lock操作可以被同一条线程重复执行多次,多次执行lock之后,只有执行相同次数的unlock操作,变量才会被解锁。

如果对一个变量执行lock操作,那将会清空工作内存中该变量的值,在执行引擎使用这个变量前,需要重新执行load或assign操作初始化变量的值。

如果一个变量事先没有被lock操作锁定,那就不允许对它执行unlock操作,也不允许去unlock一个被其他线程锁定住的变量。

对一个变量执行unlock操作之前,必须先把此变量同步回主存中。

(3)对于volatile型变量的特殊规则

关键字volatile是JVM提供的最轻量级的同步机制,java内存模型对volatile专门定义了一些特殊的访问规则。

当一个变量定义为volatile之后,它将具备两种特性,第一是保证此变量对所有线程的可见性,这里的“可见性”是指当一条线程修改了这个变量的值,新值对于其他线程来说是可以立即得知的,而普通变量不能做到这一点,普通变量的值在线程间传递均需要通过主内存来完成,即线程A修改了一个普通变量的值,线程B只有在线程A将修改同步到主内存之后,再进行读取操作,才能得到变量的新值。

“volatile变量在各个线程的工作内存中不存在一致性问题”。其实在各个线程的工作内存中,volatile变量也可以存在不一致的情况,但由于每次使用之前都要先刷新,执行引擎看不到不一致的情况,因此可以认为不存在一致性问题。但是java里的操作并非原子操作,导致volatile变量的运算在并发下一样是不安全的。

也就是说,如果不考虑线程并发(可以有多个线程,但它们不会并发执行),volatile变量不存在一致性问题。如果多线程并发,那么volatile变量也一样是不安全的。如下示例:用20个线程对一个初值为0的volatile变量进行自增,每个线程自增10000(执行次数一定要大一点儿,不然模拟不出效果)次,那么最后结果应该是200000,但是多次执行的结果都会小于200000。

package C;
public class VolatileTest {

    public static volatile int race = 0;
    
    public static void increase(){
        race++;
    }
    
    private static final int THREADS_COUNT = 20;
    
    public static void main(String[] args) {
        
        Thread[] threads = new Thread[THREADS_COUNT];
        
        for(int i=0;i<THREADS_COUNT;i++){
            threads[i] = new Thread(new Runnable() {//每个线程将race自增10次
                @Override
                public void run() {
                    // TODO Auto-generated method stub
                    for(int i=0;i<10000;i++){
                        increase();
                    }
                }
            });
            threads[i].start();
        }
        
        while(Thread.activeCount()>1)
            Thread.yield();
        
        System.out.println(race);
        
    }
}

为什么会出现上述情况呢?这是因为每个线程在操作race变量时,都要执行以下操作:从主内存读取(read)、载入到工作内存(load)、使用(use,这里是将race变量自增)、赋值(assign,这里是将自增以后的race重新赋值给工作内存中的race)、存储(store,把工作内存中的race变量的值传送到主内存)、写入(write,将工作内存中传来的race变量的值赋给主内存中的race变量)。每个线程都要执行这一个流程的六步操作,但是某个线程在执行到一个流程的第三个操作的时候,另一个线程也开始执行,那么后执行完流程的线程,将会将它的执行结果覆盖掉前一个线程的执行结果,于是主内存中的race变量的值最后可定会小于200000。

由于volatile变量只能保证可见性,在不符合以下两条规则的运算场景中,我们仍要通过加锁来保证原子性。

a.运算结果并不依赖变量的当前值(线程只用当前变量,而不对当前变量进行修改),或者能够确保只有单一的线程修改变量的值。

b.变量不需要与其他的状态变量共同参与不变约束。

如下实例就可以用volatile来控制并发:

volatile boolean shutdownFlag;
    
    public void shutdown(){
        shutdownFlag = true;
    }
    
    public void doWork(){
        while(!shutdownFlag){
            //do stuff
        }
    }

使用volatile变量的第一语义就是保证此变量对所有线程可见性。那第二就是禁止指令重排序优化。普通的变量仅仅会保证在该方法的执行过程中所有依赖赋值结果的地方都能获取到正确的结果,而不能保证变量赋值操作的顺序与程序代码中的执行顺序一致。

为什么volatile禁止指令重排序呢?因为指令重排序会影响程序的并发执行。看如下伪代码:

    Map configOptions;
    char[] configText;
    
    //此变量必须定义为volatile
    volatile boolean initialized = false;
    
    //线程A读取配置信息,读取完后将initialized设置为true以通知其他线程配置可用
    configOptions = new HashMap();
    configText = readConfigFile(fileName);
    processConfigOptions(configText,configOptions);
    initialized = true;
    
    //线程B等待线程A读取完配置信息,使用配置信息
    while(!initialized){
        sleep();
    }
    doSomethingWithConfig();

如果定义initialized变量时没有用volatile变量修饰,那么就可能会由于指令重排序的优化,导致位于线程A中的最后一句initialized = true提前执行(指令重排序优化是机器级的优化操作,提前执行是指这句话对应的汇编代码被提前执行),这样在线程B中使用配置信息的代码就可能出现错误。

用volatile修饰变量,相当于给变量增加了一个内存屏障(相当于执行了lock操作)。增加了内存屏障之后,指令重排序时不能把后面的指令重排序到内存屏障之前的位置。只有一个CPU访问内存时,并不需要内存屏障;但如果有两个或更多的CPU访问同一块内存,且其中有一个在观测另一个,就需要内存屏障来保证一致性。内存屏障的作用是使得本CPU的Cache写入了内存,该写入动作也会引起别的CPU或者别的内核无效化其Cache,这种操作相当于对Cache中的变量做了一次java内存模式中所说的“store和write”操作。

为什么说volatile禁止指令重排序呢?从硬件架构上讲,指令重排序是指CPU采用了允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理。但并不是说指令任意重排,CPU需要能正确处理指令依赖情况以保障程序能得出正确的执行结果。比如指令1把地址A中的值加10,指令2把地址A中的值乘以2,指令3把地址B中的值减去3,这时指令1和指令2是有依赖的(volatile就是确定依赖的),他们之间的顺序不能重排,但指令3可以排到指令1、2之前或中间,只要保证CPU执行后面依赖到A、B值的操作时能获取到正确的A和B即可。所以在一个CPU内部,重排序看起来依然是有序的,因此指令把修改同步到内存时,意味着之前的操作都已经执行完成,这样便形成了“指令重排序无法约过内存屏障”的效果。

volatile的同步机制的性能要优于锁,但是由于虚拟机对锁实行的许多消除和优化,会让开发人员觉得volatile并没有比锁快多少。实际上,volatile变量读操作的性能和普通变量差不多,但是写操作就可能慢一点儿,因为它需要在本地代码中插入许多内存屏障指令来保证处理器不发生乱序执行。

java内存模型对volatile变量定义的特殊规则:

a.线程在使用volatile修饰的变量之前,也就是执行use操作之前,必须先从主内存中读取变量的值,即必须先执行read和load操作。

b.线程在对volatile修饰的变量执行assign操作之后,必须对该变量执行store和write操作。保证每次修改变量都必须立刻同步回主内存,用于保证其他线程可以看到变量的修改。

c.volatile修饰的变量,如果A动作是线程T对变量执行use操作,B动作是use操作对应的load操作;如果C动作是线程T对变量执行use动作,D动作是use操作对应的load操作。如果A动作先于C动作,则B动作先于D动作。

(4)对于long和double型变量的特殊规则

java内存模型要求lock、unlock、read、load、use、assign、store、write这八个操作都具有原子性,但是对于64位的数据类型(long和double),在模型中特别定义了一条相对宽松的规定:允许虚拟机将没有被volatile修饰的64位数据的读写操作划分为两次32为的操作来进行,即允许虚拟机实现选择可以不保证64位数据类型的load、store、read和write这4个操作的原子性。

如果有多个线程共享一个并未声明为volatile的long或double类型的变量,并且同时对它们进行读取和修改操作,那么某些线程可能会读取到一个既非原值,也不是其他线程修改值的代表了“半个变量”的数值。

不过这种读取到“半个变量”的情况非常罕见,因为java内存模型虽然允许虚拟机不把long或double变量的读写实现成原子操作,但允许虚拟机选择把这些操作实现为具有原子性的操作,而且几乎所有的虚拟机都把64位数据的读写操作作为原子操作来对待。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值