Java并发之CPU原子操作、Java原子操作

原子(atomic)本意是不能被进一步分割的最小粒子,而原子操作(atomic operation)意为不可被中断的一个或一系列操作。无论是多核cpu的原子操作还是Java的原子操作,本质上都是多个操作去操作同一片内存的数据。首先整理一下多核CPU的原子操作,然后类比着学习Java多线程是如何实现原子操作的。

一、多核CPU的原子操作

假设A、B、C分别是三个CPU,主内存中存储的是每个CPU共享的变量,每个CPU分别有自己的缓冲行,缓存的是要用到的共享内存中的变量。每个CPU对变量进行读写时,优先操作自己缓存行中的数据。如果自己缓存行中的数据不是最新的,自己缓存行中的数据会变为不可用,此时CPU必须去主内存中重新拿值。

上面的描述过程中涉及到几个问题:

  1. 当缓存行中的数据是最新的数据时,如何排除其他CPU的干扰?(例如:CPUA确认缓存行中的数据是最新的,并岁该数据要进行计算,但是该数据的计算后的值还没有被重新写入到主内存中之前,出现CPUB在此时要修改主内存的数据)
  2. CPU是如何知道自己缓存行中的数据不是最新的?

上面两个问题的处理办法:

  1. 通过总线锁保证原子性,所谓总线锁就是使用处理器提供的一个
    LOCK#信号,当一个处理器在总线上输出此信号时,其他处理器的请求将被阻塞住,那么该处理器可以独占共享内存。(举例来说,就是CPUA在对主内存中的某个数据进行操作之前,先告诉其他CPU,我现在要改一个主内存中的值,你们先等一会,也就是先阻塞一会)
  2. 利用缓存一致性机制,每个操作主内存中变量的CPU在操作的同事会给其他的CPU缓存行进行标记,也就是因特尔的MESI协议,下面会详细介绍。(简单来说,就是把缓存行中的数据是否被修改过,被谁修改的,能不能直接使用的信息标记一下)

在这里插入图片描述

缓存一致性机制

最出名的就是Intel 的MESI协议,MESI协议保证了每个缓存中使用的共享变量的副本是一致的。这部分参考这篇文章

MESI的核心的思想是:当CPU写数据时,如果发现操作的变量是共享变量,即在其他CPU中也存在该变量的副本,会发出信号通知其他CPU将该变量的缓存行置为无效状态,因此当其他CPU需要读取这个变量时,发现自己缓存中缓存该变量的缓存行是无效的,那么它就会从内存重新读取。

在MESI协议中,每个缓存可能有4个状态:

  • M(Modified):这行数据有效,数据被修改了,和内存中的数据不一致,数据只存在于本Cache中。
  • E(Exclusive):这行数据有效,数据和内存中的数据一致,数据只存在于本Cache中。
  • S(Shared):这行数据有效,数据和内存中的数据一致,数据存在于很多Cache中。
  • I(Invalid):这行数据无效。
二、Java多线程的原子操作

Java中通过循环CAS(Compare and Swap)的方式来实现原子操作。其中Java的锁相当于CPU中的总线锁,Java中的循环CAS就相当于CPU的缓存一致性机制。

这里补充一下,java的字节码指令都是运行在JVM里的,在JVM中,通过参数给JVM分配的内存相当于上面提到共享内存,Java的每个线程可以类比为每个CPU,JVM为每个线程分配了自己的内存,这部分内存类比为CPU的缓存行。

关于的介绍参考这里立即查看

循环CAS

JVM中的CAS操作正是利用了处理器提供的CMPXCHG指令实现的。自旋CAS实现的基本思路就是循环进行CAS操作直到成功为止。以下代码实现了一个基于CAS线程安全的计数器方法safeCount和一个非线程安全的计数器count。

import java.util.ArrayList;
import java.util.List;
import java.util.concurrent.atomic.AtomicInteger;

public class Demo {
    
    private AtomicInteger atomicI = new AtomicInteger(0);
    private int i = 0;
    public static void main(String[] args) {
        final Demo cas = new Demo();
        List<Thread> ts = new ArrayList<Thread>(600);
        long start = System.currentTimeMillis();
        for (int j = 0; j < 100; j++) {
            Thread t = new Thread(new Runnable() {
                @Override
                public void run() {
                    for (int i = 0; i < 10000; i++) {
                        cas.count();
                        cas.safeCount();
                    }
                }
            });
            ts.add(t);
        }
        for (Thread t : ts) {
            t.start();
        }
        //等待所有线程执行完成
        for (Thread t : ts) {
            try {
                t.join();
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
        System.out.println(cas.i);
        System.out.println(cas.atomicI.get());
        System.out.println(System.currentTimeMillis() - start);
    }
    /**
     * 使用CAS实现线程安全计数器
     */
    private void safeCount() {
        for (;;) {
            int i = atomicI.get();
            boolean suc = atomicI.compareAndSet(i, ++i);
            if (suc) {
                break;
            }
        }
    }
    /**
     * 非线程安全计数器*/
    private void count() {
        i++;
    }
}

JDK的并发包里提供了一些类来支持原子操作,如AtomicBoolean(用原子方式更新的boolean值)、AtomicInteger(用原子方式更新的int值)和AtomicLong(用原子方式更新的long值)。这些原子包装类还提供了有用的工具方法,比如以原子的方式将当前值自增1和自减1。

CAS实现原子操作的三大问题

  • 1)ABA问题。因为CAS需要在操作值的时候,检查值有没有发生变化,如果没有发生变化则更新,但是如果一个值原来是A,变成了B,又变成了A,那么使用CAS进行检查时会发现它的值没有发生变化,但是实际上却变化了。ABA问题的解决思路就是使用版本号。在变量前面追加上版本号,每次变量更新的时候把版本号加1,那么A→B→A就会变成1A→2B→3A。从Java 1.5开始,JDK的Atomic包里提供了一个类AtomicStampedReference来解决ABA问题。这个类的compareAndSet方法的作用是首先检查当前引用是否等于预期引用,并且检查当前标志是否等于预期标志,如果全部相等,则以原子方式将该引用和该标志的值设置为给定的更新值。
  • 2)循环时间长开销大。自旋CAS如果长时间不成功,会给CPU带来非常大的执行开销。如果JVM能支持处理器提供的pause指令,那么效率会有一定的提升。pause指令有两个作用:第一,它可以延迟流水线执行指令(de-pipeline),使CPU不会消耗过多的执行资源,延迟的时间取决于具体实现的版本,在一些处理器上延迟时间是零;第二,它可以避免在退出循环的时候因内存顺序冲突(Memory Order Violation)而引起CPU流水线被清空(CPU Pipeline Flush),从而提高CPU的执行效率。
  • 3)只能保证一个共享变量的原子操作。当对一个共享变量执行操作时,我们可以使用循环CAS的方式来保证原子操作,但是对多个共享变量操作时,循环CAS就无法保证操作的原子性,这个时候就可以用锁。还有一个取巧的办法,就是把多个共享变量合并成一个共享变量来操作。比如,有两个共享变量i=2,j=a,合并一下ij=2a,然后用CAS来操作ij。从Java 1.5开始,JDK提供了AtomicReference类来保证引用对象之间的原子性,就可以把多个变量放在一个对象里来进行CAS操作。

锁机制保证了只有获得锁的线程才能够操作锁定的内存区域。JVM内部实现了很多种锁机制,有偏向锁、轻量级锁和互斥锁。有意思的是除了偏向锁,JVM实现锁的方式都用了循环CAS,即当一个线程想进入同步块的时候使用循环CAS的方式来获取锁,当它退出同步块的时候使用循环CAS释放锁。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值