目录
时间:20200329
事件:CAS入门,搞清楚原理
1、悲观锁 + 乐观锁
1.1 悲观锁:
思想:共享资源每次只给一个线程使用,其他线程阻塞,用完后再把资源转让给其他线程。
白话:数据库层面加锁。总是假设最坏的情况,每次拿数据的时候都认为数据会被修改,所以每次再拿数据的时候都会上锁,导致别人想要那这个数据就会被阻塞直到它拿到锁。
实例:传统的关系型数据库中使用多,如读锁、写锁、行锁、表锁等;java中的synchronized和Reentrantlock等独占锁。
1.2 乐观锁:
思想:之所以叫乐观,因为这个模式没有从数据库加锁。表中有一个版本字段,第一次读的时候,获取到这个字段。处理完业务逻辑开始更新的时候,需要再次查看该字段的值是否和第一次的一样。如果一样更新,反之拒绝。
白话:总是假设最好的情况,每次拿数据的时候认为数据不会被修改,所以不会上锁,但是在更新的时候会判断一下在此期间这个数据有没有更新,通过版本号机制和CAS算法实现。
适用场景 | |
乐观锁 | 多读,冲突几率小 |
悲观锁 | 多写,冲突几率大 |
1.2.1 乐观锁常见实现方式
- 1、版本号机制
一般是在数据表中加上一个数据版本号version字段,表示数据被修改的次数,当数据被修改时,version值会加一。当线程A要更新数据值时,在读取数据的同时也会读取version值,在提交更新时,若刚才读取到的version值为当前数据库中的version值相等时才更新,否则重试更新操作,直到更新成功。
举一个简单的例子: 假设数据库中帐户信息表中有一个 version 字段,当前值为 1 ;而当前帐户余额字段( balance )为 $100 。
- 操作员 A 此时将其读出( version=1 ),并从其帐户余额中扣除 $50( $100-$50 )。
- 在操作员 A 操作的过程中,操作员B 也读入此用户信息( version=1 ),并从其帐户余额中扣除 $20 ( $100-$20 )。
- 操作员 A 完成了修改工作,将数据版本号加一( version=2 ),连同帐户扣除后余额( balance=$50 ),提交至数据库更新,此时由于提交数据版本大于数据库记录当前版本,数据被更新,数据库记录 version 更新为 2 。
- 操作员 B 完成了操作,也将版本号加一( version=2 )试图向数据库提交数据( balance=$80 ),但此时比对数据库记录版本时发现,操作员 B 提交的数据版本号为 2 ,数据库记录当前版本也为 2 ,不满足 “ 提交版本必须大于记录当前版本才能执行更新 “ 的乐观锁策略,因此,操作员 B 的提交被驳回。
这样,就避免了操作员 B 用基于 version=1 的旧数据修改的结果覆盖操作员A 的操作结果的可能。
- 2、CAS算法(compare and swap, 比较和交换)
思想:无锁编程,非阻塞同步(non-blocking synchronized),不使用锁的情况下实现多线程间的变量同步,即没有线程被阻塞的情况下实现变量的同步。
白话:当多个线程尝试使用CAS同时更新同一个变量时,只有其中一个线程能更新变量的值,而其它线程都失败,失败的线程并不会被挂起,而是被告知这次竞争中失败,并可以再次尝试。
CAS
操作中包含三个操作数 :
- 需要读写的内存位置
V
- 进行比较的预期原值
A
- 拟写入的新值
B
如果内存位置V
的值与预期原值A
相匹配,那么处理器会自动将该位置值更新为新值B
。否则处理器不做任何操作。无论哪种情况,它都会在 CAS
指令之前返回该位置的值(在 CAS
的一些特殊情况下将仅返回 CAS
是否成功,而不提取当前值)。CAS
有效地说明了“ 我认为位置 V
应该包含值 A
;如果包含该值,则将 B
放到这个位置;否则,不要更改该位置,只告诉我这个位置现在的值即可。 ”这其实和乐观锁的冲突检查+数据更新的原理是一样的。
1.2.2 CAS算法缺点
- 1 ABA 问题
如果一个变量V初次读取的时候是A值,并且在准备赋值的时候检查到它仍然是A值,那我们就能说明它的值没有被其他线程修改过了吗?很明显是不能的,因为在这段时间它的值可能被改为其他值,然后又改回A,那CAS操作就会误认为它从来没有被修改过。这个问题被称为CAS操作的 "ABA"问题。
JDK 1.5 以后的 AtomicStampedReference 类
就提供了此种能力,其中的 compareAndSet 方法
就是首先检查当前引用是否等于预期引用,并且当前标志是否等于预期标志,如果全部相等,则以原子方式将该引用和该标志的值设置为给定的更新值。
- 2 循环时间长开销大
自旋CAS(也就是不成功就一直循环执行直到成功)如果长时间不成功,会给CPU带来非常大的执行开销。 如果JVM能支持处理器提供的pause指令那么效率会有一定的提升,pause指令有两个作用,第一它可以延迟流水线执行指令(de-pipeline),使CPU不会消耗过多的执行资源,延迟的时间取决于具体实现的版本,在一些处理器上延迟时间是零;第二它可以避免在退出循环的时候因内存顺序冲突(memory order violation)而引起CPU流水线被清空(CPU pipeline flush),从而提高CPU的执行效率。
- 3 只能保证一个共享变量的原子操作
CAS 只对单个共享变量有效,当操作涉及跨多个共享变量时 CAS 无效。但是从 JDK 1.5开始,提供了AtomicReference类
来保证引用对象之间的原子性,你可以把多个变量放在一个对象里来进行 CAS 操作.所以我们可以使用锁或者利用AtomicReference类
把多个共享变量合并成一个共享变量来操作。