Java并发之CPU原子操作、Java原子操作

最新推荐文章于 2024-01-08 20:00:21 发布

-yanhui-

最新推荐文章于 2024-01-08 20:00:21 发布

阅读量603

点赞数 1

分类专栏： Java并发文章标签： cpu原子操作 java原子性 cas 缓存一致性 MESI

本文链接：https://blog.csdn.net/xyh930929/article/details/84633492

版权

Java并发专栏收录该内容

3 篇文章 0 订阅

订阅专栏

原子(atomic)本意是不能被进一步分割的最小粒子，而原子操作(atomic operation)意为不可被中断的一个或一系列操作。无论是多核cpu的原子操作还是Java的原子操作，本质上都是多个操作去操作同一片内存的数据。首先整理一下多核CPU的原子操作，然后类比着学习Java多线程是如何实现原子操作的。

一、多核CPU的原子操作

假设A、B、C分别是三个CPU，主内存中存储的是每个CPU共享的变量，每个CPU分别有自己的缓冲行，缓存的是要用到的共享内存中的变量。每个CPU对变量进行读写时，优先操作自己缓存行中的数据。如果自己缓存行中的数据不是最新的，自己缓存行中的数据会变为不可用，此时CPU必须去主内存中重新拿值。

上面的描述过程中涉及到几个问题：

当缓存行中的数据是最新的数据时，如何排除其他CPU的干扰？（例如：CPUA确认缓存行中的数据是最新的，并岁该数据要进行计算，但是该数据的计算后的值还没有被重新写入到主内存中之前，出现CPUB在此时要修改主内存的数据）
CPU是如何知道自己缓存行中的数据不是最新的？

上面两个问题的处理办法：

通过总线锁保证原子性，所谓总线锁就是使用处理器提供的一个
LOCK#信号,当一个处理器在总线上输出此信号时，其他处理器的请求将被阻塞住，那么该处理器可以独占共享内存。（举例来说，就是CPUA在对主内存中的某个数据进行操作之前，先告诉其他CPU，我现在要改一个主内存中的值，你们先等一会，也就是先阻塞一会）
利用缓存一致性机制，每个操作主内存中变量的CPU在操作的同事会给其他的CPU缓存行进行标记，也就是因特尔的MESI协议，下面会详细介绍。（简单来说，就是把缓存行中的数据是否被修改过，被谁修改的，能不能直接使用的信息标记一下）

在这里插入图片描述

缓存一致性机制

最出名的就是Intel 的MESI协议，MESI协议保证了每个缓存中使用的共享变量的副本是一致的。这部分参考这篇文章

MESI的核心的思想是：当CPU写数据时，如果发现操作的变量是共享变量，即在其他CPU中也存在该变量的副本，会发出信号通知其他CPU将该变量的缓存行置为无效状态，因此当其他CPU需要读取这个变量时，发现自己缓存中缓存该变量的缓存行是无效的，那么它就会从内存重新读取。

在MESI协议中，每个缓存可能有4个状态：

M(Modified)：这行数据有效，数据被修改了，和内存中的数据不一致，数据只存在于本Cache中。
E(Exclusive)：这行数据有效，数据和内存中的数据一致，数据只存在于本Cache中。
S(Shared)：这行数据有效，数据和内存中的数据一致，数据存在于很多Cache中。
I(Invalid)：这行数据无效。

二、Java多线程的原子操作

Java中通过锁和循环CAS（Compare and Swap）的方式来实现原子操作。其中Java的锁相当于CPU中的总线锁，Java中的循环CAS就相当于CPU的缓存一致性机制。

这里补充一下，java的字节码指令都是运行在JVM里的，在JVM中，通过参数给JVM分配的内存相当于上面提到共享内存，Java的每个线程可以类比为每个CPU，JVM为每个线程分配了自己的内存，这部分内存类比为CPU的缓存行。

关于锁的介绍参考这里立即查看

循环CAS

JVM中的CAS操作正是利用了处理器提供的CMPXCHG指令实现的。自旋CAS实现的基本思路就是循环进行CAS操作直到成功为止。以下代码实现了一个基于CAS线程安全的计数器方法safeCount和一个非线程安全的计数器count。

import java.util.ArrayList;
import java.util.List;
import java.util.concurrent.atomic.AtomicInteger;

public class Demo {
    
    private AtomicInteger atomicI = new AtomicInteger(0);
    private int i = 0;
    public static void main(String[] args) {
        final Demo cas = new Demo();
        List<Thread> ts = new ArrayList<Thread>(600);
        long start = System.currentTimeMillis();
        for (int j = 0; j < 100; j++) {
            Thread t = new Thread(new Runnable() {
                @Override
                public void run() {
                    for (int i = 0; i < 10000; i++) {
                        cas.count();
                        cas.safeCount();
                    }
                }
            });
            ts.add(t);
        }
        for (Thread t : ts) {
            t.start();
        }
        //等待所有线程执行完成
        for (Thread t : ts) {
            try {
                t.join();
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
        System.out.println(cas.i);
        System.out.println(cas.atomicI.get());
        System.out.println(System.currentTimeMillis() - start);
    }
    /**
     * 使用CAS实现线程安全计数器
     */
    private void safeCount() {
        for (;;) {
            int i = atomicI.get();
            boolean suc = atomicI.compareAndSet(i, ++i);
            if (suc) {
                break;
            }
        }
    }
    /**
     * 非线程安全计数器*/
    private void count() {
        i++;
    }
}

JDK的并发包里提供了一些类来支持原子操作,如AtomicBoolean(用原子方式更新的boolean值)、AtomicInteger(用原子方式更新的int值)和AtomicLong(用原子方式更新的long值)。这些原子包装类还提供了有用的工具方法,比如以原子的方式将当前值自增1和自减1。

CAS实现原子操作的三大问题

1)ABA问题。因为CAS需要在操作值的时候,检查值有没有发生变化,如果没有发生变化则更新,但是如果一个值原来是A,变成了B,又变成了A,那么使用CAS进行检查时会发现它的值没有发生变化,但是实际上却变化了。ABA问题的解决思路就是使用版本号。在变量前面追加上版本号,每次变量更新的时候把版本号加1,那么A→B→A就会变成1A→2B→3A。从Java 1.5开始,JDK的Atomic包里提供了一个类AtomicStampedReference来解决ABA问题。这个类的compareAndSet方法的作用是首先检查当前引用是否等于预期引用,并且检查当前标志是否等于预期标志,如果全部相等,则以原子方式将该引用和该标志的值设置为给定的更新值。
2)循环时间长开销大。自旋CAS如果长时间不成功,会给CPU带来非常大的执行开销。如果JVM能支持处理器提供的pause指令,那么效率会有一定的提升。pause指令有两个作用:第一,它可以延迟流水线执行指令(de-pipeline),使CPU不会消耗过多的执行资源,延迟的时间取决于具体实现的版本,在一些处理器上延迟时间是零;第二,它可以避免在退出循环的时候因内存顺序冲突(Memory Order Violation)而引起CPU流水线被清空(CPU Pipeline Flush),从而提高CPU的执行效率。
3)只能保证一个共享变量的原子操作。当对一个共享变量执行操作时,我们可以使用循环CAS的方式来保证原子操作,但是对多个共享变量操作时,循环CAS就无法保证操作的原子性,这个时候就可以用锁。还有一个取巧的办法,就是把多个共享变量合并成一个共享变量来操作。比如,有两个共享变量i=2,j=a,合并一下ij=2a,然后用CAS来操作ij。从Java 1.5开始,JDK提供了AtomicReference类来保证引用对象之间的原子性,就可以把多个变量放在一个对象里来进行CAS操作。

锁机制保证了只有获得锁的线程才能够操作锁定的内存区域。JVM内部实现了很多种锁机制,有偏向锁、轻量级锁和互斥锁。有意思的是除了偏向锁,JVM实现锁的方式都用了循环CAS,即当一个线程想进入同步块的时候使用循环CAS的方式来获取锁,当它退出同步块的时候使用循环CAS释放锁。

-yanhui-

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Java并发之CPU原子操作、Java原子操作

原子(atomic)本意是“不能被进一步分割的最小粒子”，而原子操作(atomic operation)意为“不可被中断的一个或一系列操作”。无论是多核cpu的原子操作还是Java的原子操作，其实本质上都是多个操作去操作同一片内存的数据。首先整理学习一下多核CPU的原子操作，然后类比着去学习Java多线程是如何实现原子操作的。一、多核CPU的原子操作A、B、C分别是三个CPU，主内存中存储的...
复制链接

扫一扫