ConcurrentHashMap的扩容与数据迁移

最新推荐文章于 2024-07-03 19:13:37 发布

梦灸舞

最新推荐文章于 2024-07-03 19:13:37 发布

阅读量1.2k

点赞数 1

文章标签： java

本文链接：https://blog.csdn.net/qq_34908838/article/details/115019212

版权

扩容的条件

while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
                   (n = tab.length) < MAXIMUM_CAPACITY) {//1
                int rs = resizeStamp(n);//2
                if (sc < 0) {//3
                    if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                        sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                        transferIndex <= 0)
                        break;
                    if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))//4
                        transfer(tab, nt);
                }
                else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                             (rs << RESIZE_STAMP_SHIFT) + 2))//5
                    transfer(tab, null);
                s = sumCount();
            }

当s（当前集合大小）大于等于sizeCtl（扩容阈值，上一篇提到过，如果是长度16的数组，阈值为12）时并且node数组长度小于最大值时触发扩容。sizeCtl在-1时代表正在初始化node数组，初始化完成后会记录下一次触发扩容的极限值，第一条开始扩容是会赋值为一个唯一的扩容戳（基于当前node数组的长度），后续每有一个线程加入扩容时都会加一，退出扩容时都会减一，也就是说当正在扩容时，sizeCtl 的值为：((rs << RESIZE_STAMP_SHIFT) + 2) + (正在扩容的线程数-1) ，并且该状态下 sizeCtl < 0 。
生成此次扩容的唯一扩容戳，基于当前node数组生成。
sc<0代表有线程正在扩容。
有线程正在扩容的情况下加入到扩容大军中，将SIZECTL加一
如果没有线程正在扩容，则将SIZECTL设置为一个负数(rs << RESIZE_STAMP_SHIFT) + 2

transfer扩容

private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
        int n = tab.length, stride;
        if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
            stride = MIN_TRANSFER_STRIDE; // subdivide range
        if (nextTab == null) {            // initiating   1
            try {
                @SuppressWarnings("unchecked")
                Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
                nextTab = nt;
            } catch (Throwable ex) {      // try to cope with OOME
                sizeCtl = Integer.MAX_VALUE;
                return;
            }
            nextTable = nextTab;
            transferIndex = n;
        }
        int nextn = nextTab.length;
        ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);//2
        boolean advance = true;
        boolean finishing = false; // to ensure sweep before committing nextTab
        for (int i = 0, bound = 0;;) {
            Node<K,V> f; int fh;
            while (advance) {
                int nextIndex, nextBound;
                if (--i >= bound || finishing)
                    advance = false;
                else if ((nextIndex = transferIndex) <= 0) {
                    i = -1;
                    advance = false;
                }
                else if (U.compareAndSwapInt
                         (this, TRANSFERINDEX, nextIndex,
                          nextBound = (nextIndex > stride ?
                                       nextIndex - stride : 0))) {//3
                    bound = nextBound;
                    i = nextIndex - 1;
                    advance = false;
                }
            }
            if (i < 0 || i >= n || i + n >= nextn) {//4
                int sc;
                if (finishing) {
                    nextTable = null;
                    table = nextTab;
                    sizeCtl = (n << 1) - (n >>> 1);
                    return;
                }
                if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
                    if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                        return;
                    finishing = advance = true;
                    i = n; // recheck before commit
                }
            }
            else if ((f = tabAt(tab, i)) == null)
                advance = casTabAt(tab, i, null, fwd);
            else if ((fh = f.hash) == MOVED)
                advance = true; // already processed
            else {

nextTab是扩容时将数据从旧的node数组迁移到新的node数组，如果 nextTab未初始化，则进行初始化。n<<1表示原node数组16左移1位得到32，说明新的node数组长度是32。
fwd代表一个标识，当一个线程将一个node迁移完成之后，将其进行标记，其他线程再对这个node进行hash时为MOVED就直接跳过。
设置扩容边界和下标，bound=0，i=15。线程会从下标15处向前处理每一个node的数据迁移。
遍历完成后，如果完成了扩容，则更新node数组和sizeCtl下次扩容的阈值；如果没有完成扩容，则将sizeCtl减一，表示当前线程退出了扩容。

数据迁移

else {
                synchronized (f) {
                    if (tabAt(tab, i) == f) {
                        Node<K,V> ln, hn;
                        if (fh >= 0) {// 1
                            int runBit = fh & n;
                            Node<K,V> lastRun = f;
                            for (Node<K,V> p = f.next; p != null; p = p.next) {
                                int b = p.hash & n;
                                if (b != runBit) {
                                    runBit = b;
                                    lastRun = p;
                                }
                            }
                            if (runBit == 0) {
                                ln = lastRun;
                                hn = null;
                            }
                            else {
                                hn = lastRun;
                                ln = null;
                            }
                            for (Node<K,V> p = f; p != lastRun; p = p.next) { // 2
                                int ph = p.hash; K pk = p.key; V pv = p.val;
                                if ((ph & n) == 0)
                                    ln = new Node<K,V>(ph, pk, pv, ln);
                                else
                                    hn = new Node<K,V>(ph, pk, pv, hn);
                            }
                            setTabAt(nextTab, i, ln);
                            setTabAt(nextTab, i + n, hn);
                            setTabAt(tab, i, fwd);
                            advance = true;
                        }
                        else if (f instanceof TreeBin) {
                            TreeBin<K,V> t = (TreeBin<K,V>)f;
                            TreeNode<K,V> lo = null, loTail = null;
                            TreeNode<K,V> hi = null, hiTail = null;
                            int lc = 0, hc = 0;
                            for (Node<K,V> e = t.first; e != null; e = e.next) {
                                int h = e.hash;
                                TreeNode<K,V> p = new TreeNode<K,V>
                                    (h, e.key, e.val, null, null);
                                if ((h & n) == 0) {
                                    if ((p.prev = loTail) == null)
                                        lo = p;
                                    else
                                        loTail.next = p;
                                    loTail = p;
                                    ++lc;
                                }
                                else {
                                    if ((p.prev = hiTail) == null)
                                        hi = p;
                                    else
                                        hiTail.next = p;
                                    hiTail = p;
                                    ++hc;
                                }
                            }
                            ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
                                (hc != 0) ? new TreeBin<K,V>(lo) : t;
                            hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
                                (lc != 0) ? new TreeBin<K,V>(hi) : t;
                            setTabAt(nextTab, i, ln);
                            setTabAt(nextTab, i + n, hn);
                            setTabAt(tab, i, fwd);
                            advance = true;
                        }
                    }
                }
            }

fh是当前node的hash值，如果>0则表示这个节点还没有被其他线程处理过。通过fh&n（与运算，n是旧node数组的长度）得到runBit。遍历链表对runBit进行修改，最后runBit为0则将其设置为低位节点，否则设置为高位节点。

2.构造高位以及低位的链表，即将链表分为高位和地位两个链表，将低位链表的位置保持不动（即旧的node数组中是什么下标，那么在新的node数组中就是什么下标），将高位链表的位置由原先的下标n放到新node数组的n+16（扩容增加的长度）。

高低位的作用

首先在putVal（）方法中有这样一句代码tabAt(tab, i = (n - 1) & hash)来获取node数组某一下标的节点，所以很明显 (n - 1) & hash就是用来获取下标的，这个代表当前node数组的最大下标数和key的hash值的与运算。

设某个hash值为20，二进制0001 0100

当长度为16时，15&20=0000 1111 & 0001 0100=0000 0100=4

当长度为32时（扩容后），31&20=0001 1111 & 0001 0100 =0001 0100=20

可以看到，相同hash在不同的node数组长度的情况下得到的下标是不一样的。

再来看，当hash值为60时

60 & 15=0011 1100&0000 1111=0000 1100=12

60 & 31=0011 1100&0001 1111=0001 1100=28

可以看到两种hash在不同的node数组长度下，当计算下标不同时，相差都是16，也就是扩容的长度。

说白了，就是在迁移某个下标的链表时，当发现链表节点的hash和旧数组长度进行与运算fh & n的第X位为1时（为1时是高位，为0时是低位），说明这个节点的hash在扩容后和（新数组长度-1）的与运算得到的下标与原下标不同，而这个差值刚好是扩容长度16（32-16）。所以将高位直接迁移到原数组下标+扩容长度（16）的位置。

梦灸舞

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
ConcurrentHashMap的扩容与数据迁移

扩容的条件while (s >= (long)(sc = sizeCtl) && (tab = table) != null && (n = tab.length) < MAXIMUM_CAPACITY) {//1 int rs = resizeStamp(n);//2 if (sc < 0) {//3 if (
复制链接

扫一扫