Java CAS 原理分析,Java中级开发面试题

// setup to use Unsafe.compareAndSwapInt for updates

private static final Unsafe unsafe = Unsafe.getUnsafe();

private static final long valueOffset;



static {

    try {

        // 计算变量 value 在类对象中的偏移

        valueOffset = unsafe.objectFieldOffset

            (AtomicInteger.class.getDeclaredField("value"));

    } catch (Exception ex) { throw new Error(ex); }

}



private volatile int value;



public final boolean compareAndSet(int expect, int update) {

    /*  * compareAndSet 实际上只是一个壳子,主要的逻辑封装在 Unsafe 的  * compareAndSwapInt 方法中  */

    return unsafe.compareAndSwapInt(this, valueOffset, expect, update);

}



// ......

}

public final class Unsafe {

// compareAndSwapInt 是 native 类型的方法,继续往下看

public final native boolean compareAndSwapInt(Object o, long offset, int expected, int x);

// ......

}`




`// unsafe.cpp

/* * 这个看起来好像不像一个函数,不过不用担心,不是重点。UNSAFE_ENTRY 和 UNSAFE_END 都是宏, * 在预编译期间会被替换成真正的代码。下面的 jboolean、jlong 和 jint 等一些类型也都是宏: * * jni.h * typedef unsigned char jboolean; * typedef unsigned short jchar; * typedef short jshort; * typedef float jfloat; * typedef double jdouble; * * jni_md.h * typedef int jint; * #ifdef _LP64 /* 64-bit */

  • typedef long jlong;
    
  • #else
    
  • typedef long long jlong;
    
  • #endif
    
  • typedef signed char jbyte;
    

*/

UNSAFE_ENTRY(jboolean, Unsafe_CompareAndSwapInt(JNIEnv *env, jobject unsafe, jobject obj, jlong offset, jint e, jint x))

UnsafeWrapper(“Unsafe_CompareAndSwapInt”);

oop p = JNIHandles::resolve(obj);

// 根据偏移量,计算 value 的地址。这里的 offset 就是 AtomaicInteger 中的 valueOffset

jint* addr = (jint *) index_oop_from_field_offset_long(p, offset);

// 调用 Atomic 中的函数 cmpxchg,该函数声明于 Atomic.hpp 中

return (jint)(Atomic::cmpxchg(x, addr, e)) == e;

UNSAFE_END

// atomic.cpp

unsigned Atomic::cmpxchg(unsigned int exchange_value,

                     volatile unsigned int* dest, unsigned int compare_value) {

assert(sizeof(unsigned int) == sizeof(jint), “more work to do”);

/* * 根据操作系统类型调用不同平台下的重载函数,这个在预编译期间编译器会决定调用哪个平台下的重载 * 函数。相关的预编译逻辑如下: * * atomic.inline.hpp: * #include “runtime/atomic.hpp” * * // Linux * #ifdef TARGET_OS_ARCH_linux_x86 * # include “atomic_linux_x86.inline.hpp” * #endif * * // 省略部分代码 * * // Windows * #ifdef TARGET_OS_ARCH_windows_x86 * # include “atomic_windows_x86.inline.hpp” * #endif * * // BSD * #ifdef TARGET_OS_ARCH_bsd_x86 * # include “atomic_bsd_x86.inline.hpp” * #endif * * 接下来分析 atomic_windows_x86.inline.hpp 中的 cmpxchg 函数实现 */

return (unsigned int)Atomic::cmpxchg((jint)exchange_value, (volatile jint*)dest,

                                   (jint)compare_value);

}`




上面的分析看起来比较多,不过主流程并不复杂。如果不纠结于代码细节,还是比较容易看懂的。接下来,我会分析 Windows 平台下的 Atomic::cmpxchg 函数。继续往下看吧。



`// atomic_windows_x86.inline.hpp

#define LOCK_IF_MP(mp) __asm cmp mp, 0 \

__asm je L0 \

__asm _emit 0xF0 \

__asm L0:

inline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint compare_value) {

// alternative for InterlockedCompareExchange

int mp = os::is_MP();

__asm {

mov edx, dest

mov ecx, exchange_value

mov eax, compare_value

LOCK_IF_MP(mp)

cmpxchg dword ptr [edx], ecx

}

}`




上面的代码由 LOCK\_IF\_MP 预编译标识符和 cmpxchg 函数组成。为了看到更清楚一些,我们将 cmpxchg 函数中的 LOCK\_IF\_MP 替换为实际内容。如下:



`inline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint compare_value) {

// 判断是否是多核 CPU

int mp = os::is_MP();

__asm {

// 将参数值放入寄存器中

mov edx, dest    // 注意: dest 是指针类型,这里是把内存地址存入 edx 寄存器中

mov ecx, exchange_value

mov eax, compare_value



// LOCK_IF_MP

cmp mp, 0

/*  * 如果 mp = 0,表明是线程运行在单核 CPU 环境下。此时 je 会跳转到 L0 标记处,  * 也就是越过 _emit 0xF0 指令,直接执行 cmpxchg 指令。也就是不在下面的 cmpxchg 指令  * 前加 lock 前缀。  */

je L0

/*  * 0xF0 是 lock 前缀的机器码,这里没有使用 lock,而是直接使用了机器码的形式。至于这样做的  * 原因可以参考知乎的一个回答:  *     https://www.zhihu.com/question/50878124/answer/123099923  */ 

_emit 0xF0

L0:

/*  * 比较并交换。简单解释一下下面这条指令,熟悉汇编的朋友可以略过下面的解释:  *   cmpxchg: 即“比较并交换”指令  *   dword: 全称是 double word,在 x86/x64 体系中,一个  *          word = 2 byte,dword = 4 byte = 32 bit  *   ptr: 全称是 pointer,与前面的 dword 连起来使用,表明访问的内存单元是一个双字单元  *   [edx]: [...] 表示一个内存单元,edx 是寄存器,dest 指针值存放在 edx 中。  *          那么 [edx] 表示内存地址为 dest 的内存单元  *  * 这一条指令的意思就是,将 eax 寄存器中的值(compare_value)与 [edx] 双字内存单元中的值  * 进行对比,如果相同,则将 ecx 寄存器中的值(exchange_value)存入 [edx] 内存单元中。  */

cmpxchg dword ptr [edx], ecx

}

}`




到这里 CAS 的实现过程就讲完了,CAS 的实现离不开处理器的支持。以上这么多代码,其实核心代码就是一条带lock 前缀的 cmpxchg 指令,即`lock cmpxchg dword ptr [edx], ecx`。



4.ABA 问题

--------



谈到 CAS,基本上都要谈一下 CAS 的 ABA 问题。CAS 由三个步骤组成,分别是“读取->比较->写回”。考虑这样一种情况,线程1和线程2同时执行 CAS 逻辑,两个线程的执行顺序如下:



1.  时刻1:线程1执行读取操作,获取原值 A,然后线程被切换走

2.  时刻2:线程2执行完成 CAS 操作将原值由 A 修改为 B

3.  时刻3:线程2再次执行 CAS 操作,并将原值由 B 修改为 A

4.  时刻4:线程1恢复运行,将比较值(compareValue)与原值(oldValue)进行比较,发现两个值相等。  

    然后用新值(newOld)写入内存中,完成 CAS 操作



如上流程,线程1并不知道原值已经被修改过了,在它看来并没什么变化,所以它会继续往下执行流程。对于 ABA 问题,通常的处理措施是对每一次 CAS 操作设置版本号。java.util.concurrent.atomic 包下提供了一个可处理 ABA 问题的原子类 AtomicStampedReference,具体的实现这里就不分析了,有兴趣的朋友可以自己去看看。




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值