currenthashmap扩容原理_跟大佬一起读源码：CurrentHashMap的扩容机制

最新推荐文章于 2022-07-01 14:51:03 发布

VIP文章 weixin_39874350

最新推荐文章于 2022-07-01 14:51:03 发布

阅读量1.6k

点赞数

文章标签： currenthashmap扩容原理

本文链接：https://blog.csdn.net/weixin_39874350/article/details/111741387

版权

并发编程——ConcurrentHashMap#transfer() 扩容逐行分析

前言

ConcurrentHashMap 是并发中的重中之重，也是最常用的数据结构，之前的文章中，我们介绍了 putVal 方法。并发编程之 ConcurrentHashMap(JDK 1.8) putVal 源码分析。其中分析了 initTable 方法和 putVal 方法，但也留下了一句话：

这篇文章仅仅是 ConcurrentHashMap 的开头，关于 ConcurrentHashMap 里面的精华太多，值得我们好好学习。

说道精华，他的扩容方法绝对是精华，要知道，ConcurrentHashMap 扩容是高度并发的。

今天来逐行分析源码。

先说结论

首先说结论。源码加注释我会放在后面。该方法的执行逻辑如下：

通过计算 CPU 核心数和 Map 数组的长度得到每个线程(CPU)要帮助处理多少个桶，并且这里每个线程处理都是平均的。默认每个线程处理 16 个桶。因此，如果长度是 16 的时候，扩容的时候只会有一个线程扩容。

初始化临时变量 nextTable。将其在原有基础上扩容两倍。

死循环开始转移。多线程并发转移就是在这个死循环中，根据一个 finishing 变量来判断，该变量为 true 表示扩容结束，否则继续扩容。

3.1 进入一个 while 循环，分配数组中一个桶的区间给线程，默认是 16. 从大到小进行分配。当拿到分配值后，进行 i-- 递减。这个 i 就是数组下标。(其中有一个 bound 参数，这个参数指的是该线程此次可以处理的区间的最小下标，超过这个下标，就需要重新领取区间或者结束扩容，还有一个 advance 参数，该参数指的是是否继续递减转移下一个桶，如果为 true，表示可以继续向后推进，反之，说明还没有处理好当前桶，不能推进)

3.2 出 while 循环，进 if 判断，判断扩容是否结束，如果扩容结束，清空临时变量，更新 table 变量，更新库容阈值。如果没完成，但已经无法领取区间(没了)，该线程退出该方法，并将 sizeCtl 减一，表示扩容的线程少一个了。如果减完这个数以后，sizeCtl 回归了初始状态，表示没有线程再扩容了，该方法所有的线程扩容结束了。(这里主要是判断扩容任务是否结束，如果结束了就让线程退出该方法，并更新相关变量)。然后检查所有的桶，防止遗漏。

3.3 如果没有完成任务，且 i 对应的槽位是空，尝试 CAS 插入占位符，让 putVal 方法的线程感知。

3.4 如果 i 对应的槽位不是空，且有了占位符，那么该线程跳过这个槽位，处理下一个槽位。

3.5 如果以上都是不是，说明这个槽位有一个实际的值。开始同步处理这个桶。

3.6 到这里，都还没有对桶内数据进行转移，只是计算了下标和处理区间，然后一些完成状态判断。同时，如果对应下标内没有数据或已经被占位了，就跳过了。

处理每个桶的行为都是同步的。防止 putVal 的时候向链表插入数据。

4.1 如果这个桶是链表，那么就将这个链表根据 length 取于拆成两份，取于结果是 0 的放在新表的低位，取于结果是 1 放在新表的高位。

4.2 如果这个桶是红黑数，那么也拆成 2 份，方式和链表的方式一样，然后，判断拆分过的树的节点数量，如果数量小于等于 6，改造成链表。反之，继续使用红黑树结构。

4.3 到这里，就完成了一个桶从旧表转移到新表的过程。

好，以上，就是 transfer 方法的总体逻辑。还是挺复杂的。再进行精简，分成 3 步骤：

计算每个线程可以处理的桶区间。默认 16.

初始化临时变量 nextTable，扩容 2 倍。

死循环，计算下标。完成总体判断。

1 如果桶内有数据，同步转移数据。通常会像链表拆成 2 份。

大体就是上面的 3 个步骤。

再来看看源码和注释。

再看源码分析

源码加注释：

/**

* Moves and/or copies the nodes in each bin to new table. See

* above for explanation.

* transferIndex 表示转移时的下标，初始为扩容前的 length。

* 我们假设长度是 32

private final void transfer(Node[] tab, Node[] nextTab) {

int n = tab.length, stride;

// 将 length / 8 然后除以 CPU核心数。如果得到的结果小于 16，那么就使用 16。

// 这里的目的是让每个 CPU 处理的桶一样多，避免出现转移任务不均匀的现象，如果桶较少的话，默认一个 CPU(一个线程)处理 16 个桶

if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)

stride = MIN_TRANSFER_STRIDE; // subdivide range 细分范围 stridea：TODO

// 新的 table 尚未初始化

if (nextTab == null) { // initiating

try {

// 扩容 2 倍

Node[] nt = (Node[])new Node,?>[n << 1];

// 更新

nextTab = nt;

} catch (Throwable ex) { // try to cope with OOME

// 扩容失败， sizeCtl 使用 int 最大值。

sizeCtl = Integer.MAX_VALUE;

return;// 结束

}

// 更新成员变量

nextTable = nextTab;

// 更新转移下标，就是老的 tab 的 length

transferIndex = n;

}

// 新 tab 的 length

int nextn = nextTab.length;

// 创建一个 fwd 节点，用于占位。当别的线程发现这个槽位中是 fwd 类型的节点，则跳过这个节点。

ForwardingNode fwd = new ForwardingNode(nextTab);

// 首次推进为 true，如果等于 true，说明需要再次推进一个下标(i--)，反之，如果是 false，那么就不能推进下标，需要将当前的下标处理完毕才能继续推进

boolean advance = true;

// 完成状态，如果是 true，就结束此方法。

boolean finishing = false; // to ensure sweep before committing nextTab

// 死循环,i 表示下标，bound 表示当前线程可以处理的当前桶区间最小下标

for (int i = 0, bound = 0;;) {

Node f; int fh;

// 如果当前线程可以向后推进；这个循环就是控制 i 递减。同时，每个线程都会进入这里取得自己需要转移的桶的区间

while (advance) {

int nextIndex, nextBound;

// 对 i 减一，判断是否大于等于 bound (正常情况下，如果大于 bound 不成立，说明该线程上次领取的任务已经完成了。那么，需要在下面继续领取任务)

// 如果对 i 减一大于等于 bound(还需要继续做任务)，或者完成了，修改推进状态为 false，不能推进了。任务成功后修改推进状态为 true。

// 通常，第一次进入循环，i-- 这个判断会无法通过，从而走下面的 nextIndex 赋值操作(获取最新的转移下标)。其余情况都是：如果可以推进，将 i 减一，然后修改成不可推进。如果 i 对应的桶处理成功了，改成可以推进。

最低0.47元/天解锁文章

weixin_39874350

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
currenthashmap扩容原理_跟大佬一起读源码：CurrentHashMap的扩容机制

并发编程——ConcurrentHashMap#transfer() 扩容逐行分析前言ConcurrentHashMap 是并发中的重中之重，也是最常用的数据结构，之前的文章中，我们介绍了 putVal 方法。并发编程之 ConcurrentHashMap(JDK 1.8) putVal 源码分析。其中分析了 initTable 方法和 putVal 方法，但也留下了一句话：这篇文章仅仅是 Con...
复制链接

扫一扫