Java ConcurrentHashMap 高并发安全实现原理解析

最新推荐文章于 2024-05-01 15:43:39 发布

2401_83944560

最新推荐文章于 2024-05-01 15:43:39 发布

阅读量395

点赞数 5

分类专栏： 2024年程序员学习文章标签： java 安全开发语言

本文链接：https://blog.csdn.net/2401_83944560/article/details/137443117

版权

2024年程序员学习专栏收录该内容

267 篇文章 0 订阅

订阅专栏

初始值是0表示哈希表尚未初始化
如果是-1表示正在初始化，只允许一个线程进入初始化代码块
初始化或者reSize成功后，sizeCtl=loadFactor * tableSize也就是触发再次扩容的阈值，是一个正整数
在扩容过程中，sizeCtrl是一个负整数，其高16位是与当前的tableSize关联的邮戳resizeStamp，其低16位是当前从事搬运工作的线程数加1

在方法的循环体中每次都将table、sizeCtrl、nextTable赋给局部变量以保证读到的是当前的最新值，且保证逻辑计算过程中变量的稳定。

如果sizeCtrl中高16位的邮戳与当前tableSize不匹配，或者搬运线程数达到了最大值，或者所有搬运的线程都已经退出(只有在遍历完所有槽位后才会退出，否则会一直循环)，或者nextTable已经被清空，跳过搬运操作。

如果满足搬运条件，则对sizeCtrl做CAS操作，sizeCtrl>=0时设置初始线程数为2，sizeCtrl<0时将其值加1，CAS成功后开始搬运操作，失败则进入下一次循环重新判断。

首个线程设置初始值为2的原因是：线程退出时会通过CAS操作将参与搬运的总线程数-1，如果初始值按照常规做法设置成1，那么减1后就会变为0。

此时其它线程发现线程数为0时，无法区分是没有任何线程做过搬运，还是有线程做完搬运但都退出了，也就无法判断要不要加入搬运的行列。

值得注意的是，代码中的“sc == rs + 1 || sc == rs + MAX_RESIZERS“是JDK8中的明显的BUG，少了rs无符号左移16位的操作；JDK12已经修复了此问题。

2、并发搬运过程和退出机制

=================

C13Map的transfer方法

private final void transfer(Node<K, V>[] tab, Node<K, V>[] nextTab) {

int n = tab.length, stride;

//一次搬运多少个槽位

if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)

stride = MIN_TRANSFER_STRIDE;

if (nextTab == null) {

try {

//首个搬运线程，负责初始化nextTable

Node<K, V>[] nt = (Node<K, V>[]) new Node<?, ?>[n << 1];

nextTab = nt;

} catch (Throwable ex) {

sizeCtl = Integer.MAX_VALUE;

return;

}

nextTable = nextTab;

//初始化当前搬运索引

transferIndex = n;

}

int nextn = nextTab.length;

//公共的forwardingNode

ForwardingNode<K, V> fwd = new ForwardingNode<K, V>(nextTab);

boolean advance = true;

boolean finishing = false; // 保证提交nextTable之前已遍历旧表的所有槽位

for (int i = 0, bound = 0; ; ) {

Node<K, V> f;

int fh;

//循环CAS获取下一个搬运区段

while (advance) {

int nextIndex, nextBound;

//搬运已结束，或者当前区段尚未完成，退出循环体;最后一次抄底扫描时，仅辅助做i减一的运算

if (–i >= bound || finishing)

advance = false;

else if ((nextIndex = transferIndex) <= 0) {

i = -1;

advance = false;

} else if (U.compareAndSwapInt

(this, TRANSFERINDEX, nextIndex,

nextBound = (nextIndex > stride ?

nextIndex - stride : 0))) {

bound = nextBound;

i = nextIndex - 1;

advance = false;

}

if (i < 0 || i >= n || i + n >= nextn) {

int sc;

if (finishing) {

nextTable = null;

table = nextTab;

sizeCtl = (n << 1) - (n >>> 1);

return;

}

if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {

//并非最后一个退出的线程

if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)

return;

finishing = advance = true;

//异常巧妙的设计，最后一个线程推出前将i回退到最高位，等于是强制做最后一次的全表扫描；程序直接执行后续的else if代码，看有没有哪个槽位漏掉了，或者说是否全部是forwardingNode标记；

//可以视为抄底逻辑，虽然检测到漏掉槽位的概率基本是0

i = n;

}

} else if ((f = tabAt(tab, i)) == null)

//空槽位直接打上forwardingNode标记，CAS失败下一次循环继续搬运该槽位，成功则进入下一个槽位

advance = casTabAt(tab, i, null, fwd);

else if ((fh = f.hash) == MOVED)

advance = true; //最后一次抄底遍历时，正常情况下所有的槽位应该都被打上forwardingNode标记

else {

//锁定头节点

synchronized (f) {

if (tabAt(tab, i) == f) {

Node<K, V> ln, hn;

if (fh >= 0) {

//…此处省略链表搬运代码:职责是将链表拆成两份,搬运到nextTable的i和i+n槽位

setTabAt(nextTab, i, ln);

setTabAt(nextTab, i + n, hn);

//设置旧表对应槽位的头节点为forwardingNode

setTabAt(tab, i, fwd);

advance = true;

} else if (f instanceof TreeBin) {

//…此处省略红黑树搬运代码:职责是将红黑树拆成两份,搬运到nextTable的i和i+n槽位，如果满足红黑树的退化条件，顺便将其退化为链表

setTabAt(nextTab, i, ln);

setTabAt(nextTab, i + n, hn);

//设置旧表对应槽位的头节点为forwardingNode

setTabAt(tab, i, fwd);

advance = true;

}

多个线程并发搬运时，如果是首个搬运线程，负责nextTable的初始化工作；然后借助于全局的transferIndex变量从当前table的n-1槽位开始依次向低位扫描搬运，通过对transferIndex的CAS操作一次获取一个区段（默认是16），当transferIndex达到最低位时，不再能够获取到新的区段，线程开始退出，退出时会在sizeCtl上将总的线程数减一，最后一个退出的线程将扫描坐标i回退到最高位，强迫做一次抄底的全局扫描。

3、transfer过程中的读写安全性分析

=========================

（1）首先是transfer过程中是否有可能全局的哈希表table发生多次resize，或者说存在过期的风险？

===========================================================

观察nextTable提交到table的代码，发现只有在所有线程均搬运完毕退出后才会commit，所以但凡有一个线程在transfer代码块中，table都不可能被替换；所以不存在table过期的风险。

（2）有并发的写操作时，是否存在安全风险？

=========================

因为transfer操作与写操作都要竞争bin的头节点的syncronized锁，两者是互斥串行的；当写线程得到锁后，还要做doubleCheck，发现不是一开始的头节点时什么事情都不会做，发现是forwardingNode，就会加入搬运行列直到新表被提交，然后去直接操作新表。

nextTable的提交总是在所有的槽位都已经搬运完毕，插上ForwardingNode的标识之后的，因此只要新表已提交，旧表必定无法写入；这样就能够有效的避免数据写入旧表。

推理：获取到bin头节点的同步锁开始写操作----------> transfer必然未完成--------->新表必然未提交-------→写入的必然是当前表。

也就说永远不可能存在新旧两张表同时被写入的情况，table被写入时nextTable永远都只能被读取。

（3）有并发的读操作时，是否存在安全风险？

=========================

transfer操作并不破坏旧的bin结构，如果尚未开始搬运，将会照常遍历旧的BIN结构；如果已搬运完毕，会调用到forwadingNode的find方法到新表中递归查询，参考上文中的forwadingNode介绍。

九、Traverser遍历器

==================

因为iterator或containsValue等通用API的存在，以及某些业务场景确实需要遍历整个Map，设计一种安全且有性能保证的遍历机制显得理所当然。

C13Map遍历器实现的难点在于读操作与transfer可能并行，在扫描各个bin时如果遇到forwadingNode该如何处理的问题。

由于并发transfer机制的存在，在某个槽位上遇到了forwadingNode，仅表明当前槽位已被搬运，并不能代表其后的槽位一定被搬运或者尚未被搬运；也就是说其后的若干槽位是一个不可控的状态。

解决办法是引入了类似于方法调用堆栈的机制，在跳转到nextTable时记录下当前table和已经抵达的槽位并进行入栈操作，然后开始遍历下一个table的i和i+n槽位，如果遇到forwadingNode再一次入栈，周而复始循环往复；

每次如果i+n槽位如果到了右半段快要溢出的话就会遵循原来的入栈规则进行出栈，也就是回到上一个上下文节点，最终会回到初始的table也就是initialTable中的节点。

C13Map的Traverser组件

static class Traverser<K,V> {

Node<K,V>[] tab; // current table; updated if resized

Node<K,V> next; // the next entry to use

TableStack<K,V> stack, spare; // to save/restore on ForwardingNodes int index; // index of bin to use next

int baseIndex; // current index of initial table

int baseLimit; // index bound for initial table

final int baseSize; // initial table size

Traverser(Node<K,V>[] tab, int size, int index, int limit) { this.tab = tab; this.baseSize = size; this.baseIndex = this.index = index; this.baseLimit = limit; this.next = null;

} /** * 返回下一个节点 */ final Node<K,V> advance() { Node<K,V> e; if ((e = next) != null)

e = e.next;

for (;😉 {

Node<K,V>[] t; int i, n; // 局部变量保证稳定性 if (e != null)

return next = e;

if (baseIndex >= baseLimit || (t = tab) == null ||

(n = t.length) <= (i = index) || i < 0)

return next = null;

if ((e = tabAt(t, i)) != null && e.hash < 0) {

if (e instanceof ForwardingNode) {

tab = ((ForwardingNode<K,V>)e).nextTable; e = null; pushState(t, i, n); continue; } else if (e instanceof TreeBin)

e = ((TreeBin<K,V>)e).first; else

e = null; } //当前如果有跳转堆栈直接回放 if (stack != null)

recoverState(n); //没有跳转堆栈说明已经到initalTable else if ((index = i + baseSize) >= n)

index = ++baseIndex; // visit upper slots if present

} } /** * 遇到ForwardingNode时保存当前上下文 */ private void pushState(Node<K,V>[] t, int i, int n) { TableStack<K,V> s = spare; // reuse if possible

if (s != null)

spare = s.next;

else

s = new TableStack<K,V>(); s.tab = t; s.length = n; s.index = i; s.next = stack;

stack = s; } /** * 弹出上下文 * */ private void recoverState(int n) { TableStack<K,V> s; int len;

//如果当前有堆栈，且index已经到达右半段后溢出当前table,说明该回去了

//如果index还在左半段，则只辅助做index+=s.length操作 while ((s = stack) != null && (index += (len = s.length)) >= n) {

n = len;

index = s.index; tab = s.tab; s.tab = null; TableStack<K,V> next = s.next;

s.next = spare; // save for reuse

stack = next;

spare = s; } //已经到initialTable,索引自增 if (s == null && (index += baseSize) >= n)

index = ++baseIndex; }}

Java ConcurrentHashMap安全实现原理解析

假设在整个遍历过程中初始表initalTable=table1，遍历到结束时最大的表为table5，也就是在遍历过程中经历了四次扩容，属于一边遍历一边扩容的最复杂场景；

那么整个遍历过程就是一个以初始化表initalTable为基准表，以下一张表的i和i+n槽位为forwadingNode的跳转目标，类似于粒子裂变一般的从最低表向最高表放射的过程；

traverser并不能保证一定遍历某张表的所有的槽位，但如果假设低阶表的某个槽位在最高阶表总是有相应的投影，比如table1的一个节点在table5中就会对应16个投影；

traverser能够保证一次遍历的所有槽位在最高阶表上的投影，可以布满整张最高阶表，而不会有任何遗漏。

十、并发计数

==========

与HashMap中直接定义了size字段类似，获取元素的totalCount在C13MAP中肯定不会去遍历完整的数据结构；那样元素较多时性能会非常差，C13MAP设计了CounterCell[]数组来解决并发计数的问题。

CounterCell[]机制并不理会新旧table的更迭，不管是操作的新表还是旧表，对于计数而言没有本质的差异，CounterCell[]只关注总量的增加或减少。

1、从LongAdder到CounterCell内存对齐

================================

C13MAP借鉴了JUC中LongAdder和Striped64的计数机制，有大量代码与LongAdder和Striped64是重复的，其核心思想是多核环境下对于64位long型数据的计数操作，虽然借助于volatile和CAS操作能够保证并发的安全性，但是因为多核操作的是同一内存区域，而每个CPU又有自己的本地cache，例如LV1 Cache，LVL2 Cache，寄存器等。

由于内存一致性协议MESI的存在，会导致本地Cache的频繁刷新影响性能，一个比较好的解决思路是每个CPU只操作固定的一块内存对齐区域，最终采用求和的方式来计数。

这种方式能提高性能，但是并非所有场景都适用，因为其最终的value是如何估算出来的，CounterCell累加求和的过程并非原子，不能代表某个时刻的精准value，所以像compareAndSet这样的原子操作就无法支持。

2、CounterCell[] 、cellBusy、baseCount的作用

============================================

CounterCell[]中存放2的指数幂个CounterCell，并发操作期间有可能会扩容，每次扩容都是原有size的两倍，一旦超过了CPU的核数即不再扩容，因为CPU的总数通常也是2的指数幂，所以其size往往等于CPU的核数CounterCell[]初始化、扩容、填充元素时，借助cellBusy其进行spinLock控制baseCount是基础数据。

在并发量不那么大，CAS没有出现失败时直接基于baseCount变量做计数；一旦出现CAS失败，说明有并发冲突，就开始考虑CounterCell[]的初始化或者扩容操作，但在初始化未完成时，还是会将其视为抄底方案进行计数。

所以最终的技术总和=baseCount+所有CounterCell中的value。

C13Map的addCount方法

private final void addCount(long x, int check) {

CounterCell[] cs; long b, s;

//初始时总是直接对baseCount计数，直到出现第一次失败，或者已经有现成的CounterCell[]数组可用

if ((cs = counterCells) != null ||

!U.compareAndSetLong(this, BASECOUNT, b = baseCount, s = b + x)) {

CounterCell c; long v; int m;

//是否存在竞态，为true时表示无竞态

boolean uncontended = true;

if (cs == null || (m = cs.length - 1) < 0 ||

//先生成随机数再对CounterCell[]数组size求余,也就是随机分配到其中某个槽位

(c = cs[ThreadLocalRandom.getProbe() & m]) == null ||

!(uncontended =

U.compareAndSetLong(c, CELLVALUE, v = c.value, v + x))) {

//该槽位尚未初始化或者CAS操作又出现竞态

fullAddCount(x, uncontended);

return;

}

if (check <= 1)

return;

s = sumCount();

}

//检测元素总数是否超过sizeCtl阈值

if (check >= 0) {

Node<K,V>[] tab, nt; int n, sc;

while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&

(n = tab.length) < MAXIMUM_CAPACITY) {

int rs = resizeStamp(n) << RESIZE_STAMP_SHIFT;

if (sc < 0) {

if (sc == rs + MAX_RESIZERS || sc == rs + 1 ||

(nt = nextTable) == null || transferIndex <= 0)

break;

if (U.compareAndSetInt(this, SIZECTL, sc, sc + 1))

transfer(tab, nt);

}

else if (U.compareAndSetInt(this, SIZECTL, sc, rs + 2))

transfer(tab, null);

s = sumCount();

}

其中ThreadLocalRandom是线程上下文内的随机数生成器，可以不受其它线程的影响，提高随机数生成的性能；总是在CAS失败以后，也就是明确感知到存在多线程的竞争的前提下，才会对CounterCell[]进行初始化或者扩容操作。

C13Map的fullAddCount方法

//完整的计数,与LongAdder的代码基本雷同

private final void fullAddCount(long x, boolean wasUncontended) {

int h;

if ((h = ThreadLocalRandom.getProbe()) == 0) {

ThreadLocalRandom.localInit(); // force initialization

h = ThreadLocalRandom.getProbe();

wasUncontended = true;

}

boolean collide = false; // 是否有新的冲突

for (;😉 {

CounterCell[] cs; CounterCell c; int n; long v;

if ((cs = counterCells) != null && (n = cs.length) > 0) {

if ((c = cs[(n - 1) & h]) == null) {

//随机匹配的槽位尚未有CounterCell元素则初始化之

if (cellsBusy == 0) { // Try to attach new Cell

CounterCell r = new CounterCell(x); // Optimistic create

if (cellsBusy == 0 &&

U.compareAndSetInt(this, CELLSBUSY, 0, 1)) {

boolean created = false;

try { // Recheck under lock

CounterCell[] rs; int m, j;

if ((rs = counterCells) != null &&

(m = rs.length) > 0 &&

rs[j = (m - 1) & h] == null) {

rs[j] = r;

created = true;

}

} finally {

cellsBusy = 0;

}

if (created)

break;

continue; // Slot is now non-empty

}

collide = false;

}

else if (!wasUncontended)

wasUncontended = true; //fullAddCount前已经存在cas失败但并不立即扩容，重新生成一个随机数进行CAS重试

else if (U.compareAndSetLong(c, CELLVALUE, v = c.value, v + x))

break;

else if (counterCells != cs || n >= NCPU)

collide = false; // 超过CPU的最大核数，或者检测到counterCells已扩容，都将冲突状态置为无

else if (!collide)

collide = true; // 以上的若干条件都不满足，可以判定必定有冲突，再生成一个随机数试探一下

else if (cellsBusy == 0 &&

U.compareAndSetInt(this, CELLSBUSY, 0, 1)) {

try {

if (counterCells == cs) //对counterCells进行doubleCheck

counterCells = Arrays.copyOf(cs, n << 1); //扩容，容量翻倍

} finally {

cellsBusy = 0;

}

collide = false;

continue; // 对性的counterCell[]进行重试CAS操作

}

h = ThreadLocalRandom.advanceProbe(h); //以旧的随机数为基数生成一个新的随机数

}

else if (cellsBusy == 0 && counterCells == cs &&

U.compareAndSetInt(this, CELLSBUSY, 0, 1)) {

//第一次初始化工作，初始的数组大小为2

boolean init = false;

try { // Initialize table

if (counterCells == cs) {

CounterCell[] rs = new CounterCell[2];

rs[h & 1] = new CounterCell(x);

counterCells = rs;

init = true;

}

} finally {

cellsBusy = 0;

}

if (init)

break;

}

//初始化过程中其它线程的抄底方案

else if (U.compareAndSetLong(this, BASECOUNT, v = baseCount, v + x))

break;

}

循环生成新的随机数匹配到新的槽位进行CAS的计数操作，出现CAS失败后并不急于扩容；而是总是在连续出现CAS失败的情况才会尝试扩容。

CounterCell[]的整体方案相对独立，与C13Map的关系并不大，可以视为一种成熟的高性能技术方案在各个场景使用。

十一、与stream类似的bulk操作支持

=========================

1、bulkTask类的子类

==================

Java ConcurrentHashMap安全实现原理解析

所有的批量任务执行类均为bulkTask的子类, bulkTask内置了与traverser类似的实现，用以支持对C13Map的遍历；同时它也是ForkJoinTask的子类，支持以fork/join的方式来完成各种批量任务的执行。

因为ForkJoinTask并非本文的重点，这里仅列出几种有代表性的批量方法，以及相应的的task实现。

2、几种有代表性的批量方法

=================

C13Map的批量任务

//将所有的entry按照transformer函数进行二元计算，再对所有生成的结果执行action一元函数

public void forEach(long parallelismThreshold, BiFunction<? super K, ? super V, ? extends U> transformer,

Consumer<? super U> action);

//对所有的entry执行searchFunction二元计算，一旦发现任意一个计算结果不为null，即全盘返回

public U search(long parallelismThreshold, BiFunction<? super K, ? super V, ? extends U> searchFunction);

//对所有的entry执行transformer二元计算，再对所有的结果执行reducer收敛函数

public U reduce(long parallelismThreshold, BiFunction<? super K, ? super V, ? extends U> transformer,

BiFunction<? super U, ? super U, ? extends U> reducer)

//对所有的entry中的value执行transformer二元计算，再对所有的结果执行reducer收敛函数

public U reduceValues(long parallelismThreshold, Function<? super V, ? extends U> transformer,

BiFunction<? super U, ? super U, ? extends U> reducer)

以上所有的批量方法都有唯一与其对应的批量task执行类，背后均是基于fork/join思想实现。

自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数前端工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年Web前端开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上前端开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新

如果你觉得这些内容对你有帮助，可以添加V获取：vip1024c （备注前端）

基础面试题

主要内容包括：HTML，CSS，JavaScript，浏览器，性能优化等等

一个人可以走的很快，但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎扫码加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

因此收集整理了一份《2024年Web前端开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。
[外链图片转存中…(img-6huKbqUx-1712422791131)]
[外链图片转存中…(img-nENpJIGf-1712422791132)]
[外链图片转存中…(img-zoWrdi8X-1712422791132)]
[外链图片转存中…(img-fAcbIKfz-1712422791133)]
[外链图片转存中…(img-jRCLyUVu-1712422791134)]
[外链图片转存中…(img-IKesC8Xk-1712422791134)]

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上前端开发知识点，真正体系化！

如果你觉得这些内容对你有帮助，可以添加V获取：vip1024c （备注前端）
[外链图片转存中…(img-23TU2ufL-1712422791134)]

基础面试题

主要内容包括：HTML，CSS，JavaScript，浏览器，性能优化等等

[外链图片转存中…(img-M3qOAO6N-1712422791135)]

一个人可以走的很快，但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎扫码加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！
[外链图片转存中…(img-ZL0vIaqG-1712422791135)]

2401_83944560

关注

5
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
Java ConcurrentHashMap 高并发安全实现原理解析

初始值是0表示哈希表尚未初始化如果是-1表示正在初始化，只允许一个线程进入初始化代码块初始化或者reSize成功后，sizeCtl=loadFactor * tableSize也就是触发再次扩容的阈值，是一个正整数在扩容过程中，sizeCtrl是一个负整数，其高16位是与当前的tableSize关联的邮戳resizeStamp，其低16位是当前从事搬运工作的线程数加1。
复制链接

扫一扫