Java集合源码解析-ConcurrentHashMap（JDK8）

最新推荐文章于 2024-05-12 22:58:14 发布

m0_60607289

最新推荐文章于 2024-05-12 22:58:14 发布

阅读量946

点赞数 20

分类专栏： 2024年程序员学习文章标签： java 哈希算法开发语言

本文链接：https://blog.csdn.net/m0_60607289/article/details/137316230

版权

2024年程序员学习专栏收录该内容

242 篇文章 0 订阅

订阅专栏

}

//CAS 式更新baseCount，并判断是否需要扩容

addCount(1L, binCount);

//程序走到这一步说明此次 put 操作是一个添加操作，否则早就 return 返回了

return null;

注意ForwardingNode 节点类型

这个节点内部保存了一个 nextTable 引用，它指向一张 hash 表;

在扩容操作中，我们需要对每个桶中的结点进行分离和转移;

如果某个桶结点中所有节点都已经迁移完成了(已经被转移到新表 nextTable);

那么会在原 table 表的该位置挂上一个 ForwardingNode 结点，说明此桶已经完成迁移.

ForwardingNode继承自 Node 结点,并且它唯一的构造函数将构建一个k/v/next 都为 null 的结点,反正它就是个标识，无需那些属性;

但是 hash 值却为 MOVED.

所以，我们在 putVal 方法中遍历整个 hash 表的桶结点,如果遇到 hash 值等于 MOVED,说明已经有线程正在扩容 rehash 操作,整体上还未完成，,过我们要插入的桶的位置已经完成了所有节点的迁移

由于检测到当前哈希表正在扩容,于是让当前线程去协助扩容.

final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {

Node<K,V>[] nextTab; int sc;

if (tab != null && (f instanceof ForwardingNode) &&

(nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {

//返回一个 16 位长度的扩容校验标识

int rs = resizeStamp(tab.length);

while (nextTab == nextTable && table == tab && (sc = sizeCtl) < 0) {

//sizeCtl 如果处于扩容状态的话

//前 16 位是数据校验标识，后 16 位是当前正在扩容的线程总数

//这里判断校验标识是否相等，如果校验符不等或者扩容操作已经完成了，直接退出循环，不用协助它们扩容了

if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||

sc == rs + MAX_RESIZERS || transferIndex <= 0)

break;

//否则调用 transfer 帮助它们进行扩容

//sc + 1 标识增加了一个线程进行扩容

if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {

transfer(tab, nextTab);

break;

}

return nextTab;

}

return table;

}

下面我们看这个稍显复杂的 transfer 方法，我们依然分几个部分来细说。

//第一部分

/**

Moves and/or copies the nodes in each bin to new table. See
above for explanation.

private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {

int n = tab.length, stride;

//计算单个线程允许处理的最少table桶首节点个数，不能小于 16

if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)

stride = MIN_TRANSFER_STRIDE; // subdivide range 细分范围

//刚开始扩容，初始化 nextTab

if (nextTab == null) { // initiating

try {

@SuppressWarnings(“unchecked”)

Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];

nextTab = nt;

} catch (Throwable ex) {

sizeCtl = Integer.MAX_VALUE;

return;

}

nextTable = nextTab;

//transferIndex 指向最后一个桶，方便从后向前遍历

transferIndex = n;

}

int nextn = nextTab.length;

//定义 ForwardingNode 用于标记迁移完成的桶

ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);

这部分代码还是比较简单的，主要完成的是对单个线程能处理的最少桶结点个数的计算和一些属性的初始化操作。

//第二部分，并发扩容控制的核心

boolean advance = true;

boolean finishing = false; // to ensure sweep before committing nextTab

//i 指向当前桶，bound 指向当前线程需要处理的桶结点的区间下限

for (int i = 0, bound = 0;😉 {

Node<K,V> f; int fh;

//这个 while 循环的目的就是通过 --i 遍历当前线程所分配到的桶结点

//一个桶一个桶的处理

while (advance) {

int nextIndex, nextBound;

if (–i >= bound || finishing)

advance = false;

//transferIndex <= 0 说明已经没有需要迁移的桶了

else if ((nextIndex = transferIndex) <= 0) {

i = -1;

advance = false;

}

//更新 transferIndex

//为当前线程分配任务，处理的桶结点区间为（nextBound,nextIndex）

else if (U.compareAndSwapInt(this, TRANSFERINDEX, nextIndex,nextBound = (nextIndex > stride ? nextIndex - stride : 0))) {

bound = nextBound;

i = nextIndex - 1;

advance = false;

}

//当前线程所有任务完成

if (i < 0 || i >= n || i + n >= nextn) {

int sc;

if (finishing) {

nextTable = null;

table = nextTab;

sizeCtl = (n << 1) - (n >>> 1);

return;

}

if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {

if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)

return;

finishing = advance = true;

i = n;

}

//待迁移桶为空，那么在此位置 CAS 添加 ForwardingNode 结点标识该桶已经被处理过了

else if ((f = tabAt(tab, i)) == null)

advance = casTabAt(tab, i, null, fwd);

//如果扫描到 ForwardingNode，说明此桶已经被处理过了，跳过即可

else if ((fh = f.hash) == MOVED)

advance = true;

每个新参加进来扩容的线程必然先进 while 循环的最后一个判断条件中去领取自己需要迁移的桶的区间。然后 i 指向区间的最后一个位置，表示迁移操作从后往前的做。接下来的几个判断就是实际的迁移结点操作了。等我们大致介绍完成第三部分的源码再回来对各个判断条件下的迁移过程进行详细的叙述。

//第三部分

else {

synchronized (f) {

if (tabAt(tab, i) == f) {

Node<K,V> ln, hn;

//链表的迁移操作

if (fh >= 0) {

int runBit = fh & n;

Node<K,V> lastRun = f;

//整个 for 循环为了找到整个桶中最后连续的 fh & n 不变的结点

for (Node<K,V> p = f.next; p != null; p = p.next) {

int b = p.hash & n;

if (b != runBit) {

runBit = b;

lastRun = p;

}

if (runBit == 0) {

ln = lastRun;

hn = null;

}

else {

hn = lastRun;

ln = null;

}

//如果fh&n不变的链表的runbit都是0，则nextTab[i]内元素ln前逆序，ln及其之后顺序

//否则，nextTab[i+n]内元素全部相对原table逆序

//这是通过一个节点一个节点的往nextTab添加

for (Node<K,V> p = f; p != lastRun; p = p.next) {

int ph = p.hash; K pk = p.key; V pv = p.val;

if ((ph & n) == 0)

ln = new Node<K,V>(ph, pk, pv, ln);

else

hn = new Node<K,V>(ph, pk, pv, hn);

}

//把两条链表整体迁移到nextTab中

setTabAt(nextTab, i, ln);

setTabAt(nextTab, i + n, hn);

//将原桶标识位已经处理

setTabAt(tab, i, fwd);

advance = true;

}

//红黑树的复制算法，不再赘述

else if (f instanceof TreeBin) {

TreeBin<K,V> t = (TreeBin<K,V>)f;

TreeNode<K,V> lo = null, loTail = null;

TreeNode<K,V> hi = null, hiTail = null;

int lc = 0, hc = 0;

for (Node<K,V> e = t.first; e != null; e = e.next) {

int h = e.hash;

TreeNode<K,V> p = new TreeNode<K,V>(h, e.key, e.val, null, null);

if ((h & n) == 0) {

if ((p.prev = loTail) == null)

lo = p;

else

loTail.next = p;

loTail = p;

++lc;

}

else {

if ((p.prev = hiTail) == null)

hi = p;

else

hiTail.next = p;

hiTail = p;

++hc;

}

ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :(hc != 0) ? new TreeBin<K,V>(lo) : t;

hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :(lc != 0) ? new TreeBin<K,V>(hi) : t;

setTabAt(nextTab, i, ln);

setTabAt(nextTab, i + n, hn);

setTabAt(tab, i, fwd);

advance = true;

}

那么至此，有关迁移的几种情况已经介绍完成了，下面我们整体上把控一下整个扩容和迁移过程.

首先，每个线程进来会先领取自己的任务区间，然后开始 --i 来遍历自己的任务区间，对每个桶进行处理。

如果遇到桶的头结点是空的,那么使用 ForwardingNode 标识该桶已经被处理完成了
如果遇到已经处理完成的桶,直接跳过进行下一个桶的处理
如果是正常的桶,对桶首节点加锁,正常的迁移即可,迁移结束后依然会将原表的该位置标识位已经处理

当 i < 0，说明本线程处理速度够快的，整张表的最后一部分已经被它处理完了，现在需要看看是否还有其他线程在自己的区间段还在迁移中。这是退出的逻辑判断部分：

finnish 是一个标志，如果为 true 则说明整张表的迁移操作已经全部完成了，我们只需要重置 table 的引用并将 nextTable 赋为空即可。否则，CAS 式的将 sizeCtl 减一，表示当前线程已经完成了任务，退出扩容操作。

如果退出成功，那么需要进一步判断是否还有其他线程仍然在执行任务。

我们说过 resizeStamp(n) 返回的是对 n 的一个数据校验标识，占 16 位

而

的值为 16，那么位运算后，整个表达式必然在右边空出 16 个零。也正如我们所说的，sizeCtl 的高 16 位为数据校验标识，低 16 为表示正在进行扩容的线程数量

(resizeStamp(n) << RESIZE_STAMP_SHIFT) + 2

表示当前只有一个线程正在工作，相对应的，如果

(sc - 2) == resizeStamp(n) << RESIZE_STAMP_SHIFT

说明当前线程就是最后一个还在扩容的线程，那么会将 finishing 标识为 true，并在下一次循环中退出扩容方法。

这一块的难点在于对 sizeCtl 的各个值的理解，关于它的深入理解，这里推荐一篇文章。

着重理解位操作

看到这里，真的为 Doug Lea 精妙的设计而折服，针对于多线程访问问题，不但没有拒绝式得将他们阻塞在门外，反而邀请他们来帮忙一起工作。

好了，我们一路往回走，回到我们最初分析的 putVal 方法。接着前文的分析，当我们根据 hash 值，找到对应的桶结点，如果发现该结点为 ForwardingNode 结点，表明当前的哈希表正在扩容和 rehash，于是将本线程送进去帮忙扩容。否则如果是普通的桶结点，于是锁住该桶，分链表和红黑树的插入一个节点，具体插入过程类似 HashMap，此处不再赘述。

当我们成功的添加完成一个结点，最后是需要判断添加操作后是否会导致哈希表达到它的阈值，并针对不同情况决定是否需要进行扩容，还有 CAS 式更新哈希表实际存储的键值对数量。这些操作都封装在 addCount 这个方法中，当然 putVal 方法的最后必然会调用该方法进行处理。下面我们看看该方法的具体实现，该方法主要做两个事情。一是更新 baseCount，二是判断是否需要扩容。

//第一部分，更新 baseCount

private final void addCount(long x, int check) {

CounterCell[] as; long b, s;

//如果更新失败才会进入的 if 的主体代码中

//s = b + x 其中 x 等于 1

if ((as = counterCells) != null ||

!U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {

CounterCell a; long v; int m;

boolean uncontended = true;

//高并发下 CAS 失败会执行 fullAddCount 方法

if (as == null || (m = as.length - 1) < 0 || (a = as[ThreadLocalRandom.getProbe() & m]) == null ||!(uncontended =U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {

fullAddCount(x, uncontended);

return;

}

if (check <= 1)

return;

s = sumCount();

}

这一部分主要完成的是对 baseCount 的 CAS 更新。

//第二部分，判断是否需要扩容

if (check >= 0) {

Node<K,V>[] tab, nt; int n, sc;

while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&(n = tab.length) < MAXIMUM_CAPACITY) {

int rs = resizeStamp(n);

if (sc < 0) {

if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||transferIndex <= 0)

break;

if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))

transfer(tab, nt);

}

else if (U.compareAndSwapInt(this, SIZECTL, sc,(rs << RESIZE_STAMP_SHIFT) + 2))

transfer(tab, null);

s = sumCount();

}

这部分代码也是比较简单的，不再赘述。

至此，对于 put 方法的源码分析已经完全结束了，很复杂但也很让人钦佩

下面我们简单看看 remove 方法的实现。

8.4.2 remove 方法实现并发删除

无非就是先定位再删除

首先遍历整张表的桶结点，如果表还未初始化或者无法根据参数的 hash 值定位到桶结点，那么将返回 null
如果定位到的桶结点类型是ForwardingNode 结点,调用 helpTransfer 协助扩容

否则就老老实实的给桶加锁，删除一个节点

最后会调用 addCount 方法 CAS 更新 baseCount 的值。

8.4.3 size

size 方法的作用是为我们返回哈希表中实际存在的键值对的总数

可能你会有所疑问，ConcurrentHashMap 中的 baseCount 属性不就是记录的所有键值对的总数吗？直接返回它不就行了吗？

之所以没有这么做，是因为我们的 addCount 方法用 CAS 更新 baseCount，但很有可能在高并发的情况下，更新失败，那么这些节点虽然已经被添加到哈希表中了，但是数量却没有被统计.

还好，addCount 方法在更新 baseCount 失败的时候，会调用 fullAddCount 将这些失败的结点包装成一个 CounterCell 对象，保存在 CounterCell 数组中;

那么整张表实际的 size 其实是 baseCount 加上 CounterCell 数组中元素的个数.

8.4.4 get

get 方法可以根据指定的键，返回对应的键值对，由于是读操作，所以不涉及到并发问题

源码也是比较简单的

8.4.5 clear

clear 方法将删除整张哈希表中所有的键值对，删除操作也是一个桶一个桶的进行删除

public void clear() {

long delta = 0L; // negative number of deletions

int i = 0;

Node<K,V>[] tab = table;

while (tab != null && i < tab.length) {

int fh;

Node<K,V> f = tabAt(tab, i);

自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数Java工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年Java开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上Java开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新

如果你觉得这些内容对你有帮助，可以添加V获取：vip1024b （备注Java）

面试准备+复习分享：

为了应付面试也刷了很多的面试题与资料，现在就分享给有需要的读者朋友，资料我只截取出来一部分哦

秋招｜美团java一面二面HR面面经，分享攒攒人品

学效果低效又漫长，而且极易碰到天花板技术停滞不前！**

因此收集整理了一份《2024年Java开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。
[外链图片转存中…(img-VBysIfvu-1712091732965)]
[外链图片转存中…(img-zgPhEOQQ-1712091732966)]
[外链图片转存中…(img-9dKiAfrp-1712091732966)]
[外链图片转存中…(img-o4ooA8LP-1712091732966)]
[外链图片转存中…(img-TpgsXGx0-1712091732967)]
[外链图片转存中…(img-9AbyGSoE-1712091732967)]

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上Java开发知识点，真正体系化！

如果你觉得这些内容对你有帮助，可以添加V获取：vip1024b （备注Java）
[外链图片转存中…(img-4dI9vdYI-1712091732967)]

面试准备+复习分享：

为了应付面试也刷了很多的面试题与资料，现在就分享给有需要的读者朋友，资料我只截取出来一部分哦

[外链图片转存中…(img-AsDFtBdH-1712091732967)]

m0_60607289

关注

20
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
Java集合源码解析-ConcurrentHashMap（JDK8）

/CAS 式更新baseCount，并判断是否需要扩容//程序走到这一步说明此次 put 操作是一个添加操作，否则早就 return 返回了注意节点类型这个节点内部保存了一个nextTable引用，它指向一张 hash 表;在扩容操作中，我们需要对每个桶中的结点进行分离和转移;如果某个桶结点中所有节点都已经迁移完成了(已经被转移到新表 nextTable);那么会在原 table 表的该位置挂上一个 ForwardingNode 结点，说明此桶已经完成迁移.
复制链接

扫一扫