CAS 与 volatile
cas:
保证对共享变量操作的原子性
CAS 必须借助 volatile 才能读取到共享变量的最新值来实现【比较并交换】的效果
volatile:
保证共享变量的可见性
volatile 仅仅保证了共享变量的可见性,让其它线程能够看到最新值,但不能解决指令交错问题(不能保证原子性)
为什么无锁效率高:
无锁情况下,即使重试失败,线程始终在高速运行,没有停歇,而 synchronized 会让线程在没有获得锁的时候,发生上下文切换,进入阻塞。
但无锁情况下,因为线程要保持运行,需要额外 CPU 的支持,CPU 在这里就好比高速跑道,没有额外的跑道,线程想高速运行也无从谈起,虽然不会进入阻塞,但由于没有分到时间片,仍然会进入可运行状态,还是会导致上下文切换。
特点:
1、结合 CAS 和 volatile 可以实现无锁并发,适用于线程数少、多核 CPU 的场景下。
2、CAS 是基于乐观锁的思想:最乐观的估计,不怕别的线程来修改共享变量,就算改了也没关系,我吃亏点再重试呗。
3、synchronized 是基于悲观锁的思想:最悲观的估计,得防着其它线程来修改共享变量,我上了锁你们都别想改,我改完了解开锁,你们才有机会。
4、CAS 体现的是无锁并发、无阻塞并发,请仔细体会这两句话的意思
因为没有使用 synchronized,所以线程不会陷入阻塞,这是效率提升的因素之一
但如果竞争激烈,可以想到重试必然频繁发生,反而效率会受影响
原子整数
提供对基本数据类型线程安全的操作
基本实现:AtomicBoolean、AtomicInteger、AtomicLong
常用方法:
1、getAndIncrement: 获取并自增(i = 0, 结果 i = 1, 返回 0),类似于 i++
2、incrementAndGet: 自增并获取(i = 1, 结果 i = 2, 返回 2),类似于 ++i
3、decrementAndGet: 自减并获取(i = 2, 结果 i = 1, 返回 1),类似于 --i
4、getAndDecrement: 获取并自减(i = 1, 结果 i = 0, 返回 1),类似于 i--
5、getAndAdd:获取并加值
6、getAndUpdate:其中函数中的操作能保证原子,但函数需要无副作用
等等
原子引用
为什么需要原子引用?
因为除了基本数据类型以外,可能有小数,或者别的引用类型如BigDecimal进行操作。
AtomicReference
AtomicMarkableReference
AtomicStampedReference
常用方法:compareAndSet(prev,next)
ABA问题:
主线程仅能判断出共享变量的值与最初值 A 是否相同,不能感知到这种从 A 改为 B 又 改回 A 的情况。
如果主线程希望:只要有其它线程【动过了】共享变量,那么自己的 cas 就算失败,这时,仅比较值是不够的,需要再加一个版本号
解决:
AtomicStampedReference 可以给原子引用加上版本号,追踪原子引用整个的变化过程,如: A -> B -> A ->C ,通过AtomicStampedReference,我们可以知道,引用变量中途被更改了几次。
但是有时候,并不关心引用变量更改了几次,只是单纯的关心是否更改过,所以就有了AtomicMarkableReference
只关注是否被修改:
AtomicMarkableReference<GarbageBag> ref = new AtomicMarkableReference<>(bag, true);
参数2 mark 可以看作一个标记
原子数组
AtomicIntegerArray
AtomicLongArray
AtomicReferenceArray
对数组中的元素作原子操作。
字段更新器
AtomicReferenceFieldUpdater // 域 字段
AtomicIntegerFieldUpdater
AtomicLongFieldUpdater
利用字段更新器,可以针对对象的某个域(Field)进行原子操作,只能配合 volatile 修饰的字段使用,否则会出现异常
原子累加器
AtomicLong 与 LongAdder
LongAdder性能提升原因:
在有竞争时,设置多个累加单元
Therad-0 累加 Cell[0],而 Thread-1 累加Cell[1]... 最后将结果汇总。
这样它们在累加时操作的不同的 Cell 变量,因此减少了 CAS 重试失败,从而提高性能。
缓存行伪共享原理
1、cpu加载缓存数据的速度大小:
寄存器 1 cycle (4GHz 的 CPU 约为0.25ns)
L1 3~4 cycle
L2 10~20 cycle
L3 40~45 cycle
内存 120~240 cycle
2、因为 CPU 与 内存的速度差异很大,需要靠预读数据至缓存来提升效率。
3、而缓存以缓存行为单位,每个缓存行对应着一块内存,一般是 64 byte(8 个 long)
4、缓存的加入会造成数据副本的产生,即同一份数据会缓存在不同核心的缓存行中
5、CPU 要保证数据的一致性,如果某个 CPU 核心更改了数据,其它 CPU 核心对应的整个缓存行必须失效
6、当两个cell存放在一个缓存行时,有一个cell修改,别的cell使用者必须删掉改缓存行的加载。因此叫伪共享
解决方案:
@sun.misc.Contended 用来解决这个问题,它的原理是在使用此注解的对象或字段的前后各增加 128 字节大小的padding,从而让 CPU 将对象预读至缓存时占用不同的缓存行,这样,不会造成对方缓存行的失效
Unsafe
Unsafe 对象提供了非常底层的,操作内存、线程的方法,Unsafe 对象不能直接调用,只能通过反射获得
1、内存管理。包括分配内存、释放内存等。
2、非常规的对象实例化。
3、、操作类、对象、变量。
4、多线程同步cas
5、挂起与恢复。park unpark
6、内存屏障。